Freigeben über


box

Erstellt ein Box-and-Whisker-Plot aus DataFrame Spalten.

Ein Boxplot ist eine Methode zum grafischen Darstellen von Gruppen numerischer Daten über ihre Quartile. Das Feld erstreckt sich von den Q1- bis Q3-Quartilwerten der Daten mit einer Linie am Median (Q2). Die Whisker reichen von den Rändern des Felds aus, um den Bereich der Daten anzuzeigen. Standardmäßig erweitern sie nicht mehr als 1,5 × IQR (IQR = Q3 - Q1) von den Rändern des Felds und enden am weitesten entfernten Datenpunkt innerhalb dieses Intervalls. Ausreißer werden als separate Punkte gezeichnet.

Syntax

box(column=None, **kwargs)

Parameter

Parameter Typ Beschreibung
column str oder liste von str, optional Spaltenname oder Liste der Namen, die zum Erstellen des Feldplots verwendet werden sollen. Wenn None (Standard) werden alle numerischen Spalten verwendet.
**kwargs optional Zusätzliche Schlüsselwortargumente. Unterstützt precision: Ein Float, der zum Berechnen ungefährer Statistiken für das Boxplot verwendet wird. Standardwert: 0.01. Verwenden Sie kleinere Werte für genauere Statistiken.

Rückkehr

plotly.graph_objs.Figure

Beispiele

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()