Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Crea un tracciato box-and-whisker dalle DataFrame colonne.
Un tracciato box è un metodo per rappresentare graficamente gruppi di dati numerici tramite i relativi quartili. La casella si estende dai valori quartili Q1 a Q3 dei dati, con una riga in corrispondenza della mediano (Q2). I whisker si estendono dai bordi della scatola per mostrare l'intervallo dei dati. Per impostazione predefinita, si estendono non più di 1,5 × IQR (IQR = Q3 - Q1) dai bordi della casella, terminando al punto dati più lontano entro tale intervallo. Gli outlier vengono tracciati come punti separati.
Sintassi
box(column=None, **kwargs)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
column |
str o elenco di str, facoltativo | Nome di colonna o elenco di nomi da utilizzare per la creazione del tracciato box. Se None (impostazione predefinita), vengono utilizzate tutte le colonne numeriche. |
**kwargs |
opzionale | Argomenti di parole chiave aggiuntivi. Supporta precision: valore float usato per calcolare le statistiche approssimative per il tracciato box. Impostazione predefinita: 0.01. Usare valori più piccoli per statistiche più precise. |
Restituzioni
plotly.graph_objs.Figure
Examples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()