Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Cria um gráfico de caixa e bigode a partir DataFrame de colunas.
Um diagrama de caixa é um método para representar graficamente grupos de dados numéricos através dos seus quartis. A caixa estende-se dos valores do quartil Q1 ao Q3 dos dados, com uma linha na mediana (Q2). Os bigodes estendem-se a partir das bordas da caixa para mostrar o alcance dos dados. Por defeito, estendem-se no máximo 1,5 × IQR (IQR = Q3 - Q1) a partir das arestas da caixa, terminando no ponto de dados mais distante dentro desse intervalo. Os outliers são representados como pontos separados.
Sintaxe
box(column=None, **kwargs)
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
column |
Str ou lista de STR, opcional | Nome da coluna ou lista de nomes a usar para criar o diagrama de caixas. Se None (por defeito), todas as colunas numéricas são usadas. |
**kwargs |
optional | Argumentos adicionais sobre palavras-chave. Suportes precision: um float usado para calcular estatísticas aproximadas para o box plot. Padrão: 0.01. Use valores mais pequenos para estatísticas mais precisas. |
Devoluções
plotly.graph_objs.Figure
Exemplos
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()