Freigeben über


sameSemantics

Gibt zurück True , wenn die logischen Abfragepläne in beiden DataFrames gleich sind und daher dieselben Ergebnisse zurückgeben.

Syntax

sameSemantics(other: "DataFrame")

Parameter

Parameter Typ Beschreibung
other DataFrame Der andere DataFrame, mit dem verglichen werden soll.

Rückkehr

bool: Gibt an, ob diese beiden DataFrames ähnlich sind.

Hinweise

Der Gleichheitsvergleich wird hier vereinfacht, indem die kosmetischen Unterschiede wie Attributnamen toleriert werden.

Diese API kann beide DataFrames sehr schnell vergleichen, kann aber trotzdem datenframes zurückgeben False , die dieselben Ergebnisse zurückgeben, z. B. aus verschiedenen Plänen. Eine solche falsch negative Semantik kann beim Zwischenspeichern als Beispiel nützlich sein.

Diese API ist eine Entwickler-API.

Beispiele

df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True