dispersão

Cria um gráfico de dispersão com tamanhos e cores variáveis dos pontos do marcador.

As coordenadas de cada ponto são definidas por duas colunas DataFrame, e são usados círculos preenchidos para representar cada ponto. Este tipo de gráfico é útil para ver correlações complexas entre duas variáveis, como coordenadas naturais 2D como longitude e latitude, ou qualquer par de métricas que possam ser representadas uma contra a outra.

Sintaxe

scatter(x, y, **kwargs)

Parâmetros

Parâmetro Tipo Descrição
x str Nome da coluna a usar como coordenadas horizontais para cada ponto.
y STR ou lista de str Nome da coluna a usar como coordenadas verticais para cada ponto.
**kwargs optional Argumentos adicionais sobre palavras-chave.

Devoluções

plotly.graph_objs.Figure

Exemplos

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')