両方の DataFrame 内の論理クエリ プランが等しいため、同じ結果が返される場合に True を返します。
構文
sameSemantics(other: "DataFrame")
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
other |
DataFrame | 比較対象の他の DataFrame。 |
返品
bool: これら 2 つのデータフレームが似ているかどうか。
メモ
ここでの等値比較は、属性名などの外観上の違いを許容することで簡略化されています。
この API は両方の DataFrame を非常に高速に比較できますが、異なるプランから同じ結果を返す DataFrame で False を返すことができます。 このような偽の負のセマンティックは、例としてキャッシュする場合に役立ちます。
この API は開発者 API です。
例示
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True