Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Cria um gráfico de dispersão com tamanhos e cores variáveis dos pontos do marcador.
As coordenadas de cada ponto são definidas por duas colunas DataFrame, e são usados círculos preenchidos para representar cada ponto. Este tipo de gráfico é útil para ver correlações complexas entre duas variáveis, como coordenadas naturais 2D como longitude e latitude, ou qualquer par de métricas que possam ser representadas uma contra a outra.
Sintaxe
scatter(x, y, **kwargs)
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
x |
str | Nome da coluna a usar como coordenadas horizontais para cada ponto. |
y |
STR ou lista de str | Nome da coluna a usar como coordenadas verticais para cada ponto. |
**kwargs |
optional | Argumentos adicionais sobre palavras-chave. |
Devoluções
plotly.graph_objs.Figure
Exemplos
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')