Condividi tramite


dispersione

Crea un grafico a dispersione con diverse dimensioni e colore del punto indicatore.

Le coordinate di ogni punto sono definite da due colonne dataframe e i cerchi riempiti vengono usati per rappresentare ogni punto. Questo tipo di tracciato è utile per visualizzare correlazioni complesse tra due variabili, ad esempio coordinate 2D naturali come longitudine e latitudine o qualsiasi coppia di metriche che possono essere tracciate tra loro.

Sintassi

scatter(x, y, **kwargs)

Parametri

Parametro Tipo Descrizione
x str Nome della colonna da utilizzare come coordinate orizzontali per ogni punto.
y str o elenco di str Nome della colonna da utilizzare come coordinate verticali per ogni punto.
**kwargs opzionale Argomenti di parole chiave aggiuntivi.

Restituzioni

plotly.graph_objs.Figure

Examples

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')