Freigeben über


verstreuen

Erstellt ein Punktdiagramm mit unterschiedlicher Punktgröße und -farbe.

Die Koordinaten der einzelnen Punkte werden durch zwei DataFrame-Spalten definiert, und gefüllte Kreise werden verwendet, um jeden Punkt darzustellen. Diese Art von Zeichnung ist nützlich, um komplexe Korrelationen zwischen zwei Variablen zu sehen, z. B. natürliche 2D-Koordinaten wie Längengrad und Breitengrad oder ein paar Metriken, die miteinander gezeichnet werden können.

Syntax

scatter(x, y, **kwargs)

Parameter

Parameter Typ Beschreibung
x str Der Name der Spalte, die für jeden Punkt als horizontale Koordinaten verwendet werden soll.
y str oder liste von str Der Name der Spalte, die für jeden Punkt als vertikale Koordinaten verwendet werden soll.
**kwargs optional Zusätzliche Schlüsselwortargumente.

Rückkehr

plotly.graph_objs.Figure

Beispiele

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')