Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gibt zurück True , wenn die logischen Abfragepläne in beiden DataFrames gleich sind und daher dieselben Ergebnisse zurückgeben.
Syntax
sameSemantics(other: "DataFrame")
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
other |
DataFrame | Der andere DataFrame, mit dem verglichen werden soll. |
Rückkehr
bool: Gibt an, ob diese beiden DataFrames ähnlich sind.
Hinweise
Der Gleichheitsvergleich wird hier vereinfacht, indem die kosmetischen Unterschiede wie Attributnamen toleriert werden.
Diese API kann beide DataFrames sehr schnell vergleichen, kann aber trotzdem datenframes zurückgeben False , die dieselben Ergebnisse zurückgeben, z. B. aus verschiedenen Plänen. Eine solche falsch negative Semantik kann beim Zwischenspeichern als Beispiel nützlich sein.
Diese API ist eine Entwickler-API.
Beispiele
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True