Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Erstellt ein Punktdiagramm mit unterschiedlicher Punktgröße und -farbe.
Die Koordinaten der einzelnen Punkte werden durch zwei DataFrame-Spalten definiert, und gefüllte Kreise werden verwendet, um jeden Punkt darzustellen. Diese Art von Zeichnung ist nützlich, um komplexe Korrelationen zwischen zwei Variablen zu sehen, z. B. natürliche 2D-Koordinaten wie Längengrad und Breitengrad oder ein paar Metriken, die miteinander gezeichnet werden können.
Syntax
scatter(x, y, **kwargs)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
x |
str | Der Name der Spalte, die für jeden Punkt als horizontale Koordinaten verwendet werden soll. |
y |
str oder liste von str | Der Name der Spalte, die für jeden Punkt als vertikale Koordinaten verwendet werden soll. |
**kwargs |
optional | Zusätzliche Schlüsselwortargumente. |
Rückkehr
plotly.graph_objs.Figure
Beispiele
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')