sameSemantics

Retorna True quando os planos lógicos de consulta dentro de ambos os DataFrames são iguais e, portanto, retornam os mesmos resultados.

Sintaxe

sameSemantics(other: "DataFrame")

Parâmetros

Parâmetro Tipo Descrição
other DataFrame O outro DataFrame para comparar.

Devoluções

bool: Se estes dois DataFrames são semelhantes.

Notes

A comparação de igualdade aqui é simplificada ao tolerar as diferenças cosméticas, como nomes de atributos.

Esta API pode comparar ambos os DataFrames muito rapidamente, mas ainda assim pode devolver False os DataFrames que retornam os mesmos resultados, por exemplo, de planos diferentes. Esta semântica falsamente negativa pode ser útil ao fazer cache em cache, por exemplo.

Esta API é uma API para programadores.

Exemplos

df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True