Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Restituisce un nuovo dataframe contenente l'unione di righe in questo e un altro dataframe.
Sintassi
union(other: "DataFrame")
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
other |
DataFrame | Un altro dataframe che deve essere unito. |
Restituzioni
DataFrame: nuovo dataframe contenente le righe combinate con le colonne corrispondenti.
Note
Questo metodo esegue un'unione di set in stile SQL delle righe di entrambi DataFrame gli oggetti, senza deduplicazione automatica degli elementi.
Utilizzare il distinct() metodo per eseguire la deduplicazione delle righe.
Il metodo risolve le colonne in base alla posizione (non per nome), seguendo il comportamento standard in SQL.
Examples
df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+
df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+