DataFrame列から箱ひげ図を作成します。
ボックス プロットは、数値データのグループを四分位数でグラフィカルに表現する方法です。 ボックスは、データの Q1 から Q3 四分位数の値まで拡張され、中央値 (Q2) に線が表示されます。 ひげはボックスの端から伸びて、データの範囲を示します。 既定では、ボックスの端から IQR (IQR = Q3 - Q1) × 1.5 以下に拡張され、その間隔内で最も遠いデータ ポイントで終了します。 外れ値は個別のドットとしてプロットされます。
構文
box(column=None, **kwargs)
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
column |
str または str のリスト(省略可能) | ボックス プロットの作成に使用する列名または名前の一覧。
None (既定値) の場合は、すべての数値列が使用されます。 |
**kwargs |
任意 | 追加のキーワード引数。
precision: ボックス プロットの近似統計量を計算するために使用される浮動小数点数をサポートします。 既定値: 0.01。 より正確な統計を得る場合は、小さい値を使用します。 |
返品
plotly.graph_objs.Figure
例示
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()