Condividi tramite


sameSemantics

Restituisce True quando i piani di query logici all'interno di entrambi i dataframe sono uguali e quindi restituiscono gli stessi risultati.

Sintassi

sameSemantics(other: "DataFrame")

Parametri

Parametro Tipo Descrizione
other DataFrame L'altro dataframe da confrontare.

Restituzioni

bool: indica se questi due dataframe sono simili.

Note

Il confronto di uguaglianza qui è semplificato tollerando le differenze cosmetiche, ad esempio i nomi degli attributi.

Questa API può confrontare entrambi i dataframe molto veloci, ma può comunque restituire i dataframe che restituiscono False gli stessi risultati, ad esempio, da piani diversi. Tale semantica falsa negativa può essere utile durante la memorizzazione nella cache come esempio.

Questa API è un'API per sviluppatori.

Examples

df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True