Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Crea un grafico a dispersione con diverse dimensioni e colore del punto indicatore.
Le coordinate di ogni punto sono definite da due colonne dataframe e i cerchi riempiti vengono usati per rappresentare ogni punto. Questo tipo di tracciato è utile per visualizzare correlazioni complesse tra due variabili, ad esempio coordinate 2D naturali come longitudine e latitudine o qualsiasi coppia di metriche che possono essere tracciate tra loro.
Sintassi
scatter(x, y, **kwargs)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
x |
str | Nome della colonna da utilizzare come coordinate orizzontali per ogni punto. |
y |
str o elenco di str | Nome della colonna da utilizzare come coordinate verticali per ogni punto. |
**kwargs |
opzionale | Argomenti di parole chiave aggiuntivi. |
Restituzioni
plotly.graph_objs.Figure
Examples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')