Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Restituisce True quando i piani di query logici all'interno di entrambi i dataframe sono uguali e quindi restituiscono gli stessi risultati.
Sintassi
sameSemantics(other: "DataFrame")
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
other |
DataFrame | L'altro dataframe da confrontare. |
Restituzioni
bool: indica se questi due dataframe sono simili.
Note
Il confronto di uguaglianza qui è semplificato tollerando le differenze cosmetiche, ad esempio i nomi degli attributi.
Questa API può confrontare entrambi i dataframe molto veloci, ma può comunque restituire i dataframe che restituiscono False gli stessi risultati, ad esempio, da piani diversi. Tale semantica falsa negativa può essere utile durante la memorizzazione nella cache come esempio.
Questa API è un'API per sviluppatori.
Examples
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True