sameSemantics

両方の DataFrame 内の論理クエリ プランが等しいため、同じ結果が返される場合に True を返します。

構文

sameSemantics(other: "DataFrame")

パラメーター

パラメーター タイプ 説明
other DataFrame 比較対象の他の DataFrame。

返品

bool: これら 2 つのデータフレームが似ているかどうか。

メモ

ここでの等値比較は、属性名などの外観上の違いを許容することで簡略化されています。

この API は両方の DataFrame を非常に高速に比較できますが、異なるプランから同じ結果を返す DataFrame で False を返すことができます。 このような偽の負のセマンティックは、例としてキャッシュする場合に役立ちます。

この API は開発者 API です。

例示

df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True