Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Erstellt ein Box-and-Whisker-Plot aus DataFrame Spalten.
Ein Boxplot ist eine Methode zum grafischen Darstellen von Gruppen numerischer Daten über ihre Quartile. Das Feld erstreckt sich von den Q1- bis Q3-Quartilwerten der Daten mit einer Linie am Median (Q2). Die Whisker reichen von den Rändern des Felds aus, um den Bereich der Daten anzuzeigen. Standardmäßig erweitern sie nicht mehr als 1,5 × IQR (IQR = Q3 - Q1) von den Rändern des Felds und enden am weitesten entfernten Datenpunkt innerhalb dieses Intervalls. Ausreißer werden als separate Punkte gezeichnet.
Syntax
box(column=None, **kwargs)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
column |
str oder liste von str, optional | Spaltenname oder Liste der Namen, die zum Erstellen des Feldplots verwendet werden sollen. Wenn None (Standard) werden alle numerischen Spalten verwendet. |
**kwargs |
optional | Zusätzliche Schlüsselwortargumente. Unterstützt precision: Ein Float, der zum Berechnen ungefährer Statistiken für das Boxplot verwendet wird. Standardwert: 0.01. Verwenden Sie kleinere Werte für genauere Statistiken. |
Rückkehr
plotly.graph_objs.Figure
Beispiele
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()