Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Retorna True quando os planos lógicos de consulta dentro de ambos os DataFrames são iguais e, portanto, retornam os mesmos resultados.
Sintaxe
sameSemantics(other: "DataFrame")
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
other |
DataFrame | O outro DataFrame para comparar. |
Devoluções
bool: Se estes dois DataFrames são semelhantes.
Notes
A comparação de igualdade aqui é simplificada ao tolerar as diferenças cosméticas, como nomes de atributos.
Esta API pode comparar ambos os DataFrames muito rapidamente, mas ainda assim pode devolver False os DataFrames que retornam os mesmos resultados, por exemplo, de planos diferentes. Esta semântica falsamente negativa pode ser útil ao fazer cache em cache, por exemplo.
Esta API é uma API para programadores.
Exemplos
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True