Condividi tramite


scatola

Crea un tracciato box-and-whisker dalle DataFrame colonne.

Un tracciato box è un metodo per rappresentare graficamente gruppi di dati numerici tramite i relativi quartili. La casella si estende dai valori quartili Q1 a Q3 dei dati, con una riga in corrispondenza della mediano (Q2). I whisker si estendono dai bordi della scatola per mostrare l'intervallo dei dati. Per impostazione predefinita, si estendono non più di 1,5 × IQR (IQR = Q3 - Q1) dai bordi della casella, terminando al punto dati più lontano entro tale intervallo. Gli outlier vengono tracciati come punti separati.

Sintassi

box(column=None, **kwargs)

Parametri

Parametro Tipo Descrizione
column str o elenco di str, facoltativo Nome di colonna o elenco di nomi da utilizzare per la creazione del tracciato box. Se None (impostazione predefinita), vengono utilizzate tutte le colonne numeriche.
**kwargs opzionale Argomenti di parole chiave aggiuntivi. Supporta precision: valore float usato per calcolare le statistiche approssimative per il tracciato box. Impostazione predefinita: 0.01. Usare valori più piccoli per statistiche più precise.

Restituzioni

plotly.graph_objs.Figure

Examples

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()