union

Restituisce un nuovo dataframe contenente l'unione di righe in questo e un altro dataframe.

Sintassi

union(other: "DataFrame")

Parametri

Parametro	Tipo	Descrizione
`other`	DataFrame	Un altro dataframe che deve essere unito.

Restituzioni

DataFrame: nuovo dataframe contenente le righe combinate con le colonne corrispondenti.

Note

Questo metodo esegue un'unione di set in stile SQL delle righe di entrambi DataFrame gli oggetti, senza deduplicazione automatica degli elementi.

Utilizzare il distinct() metodo per eseguire la deduplicazione delle righe.

Il metodo risolve le colonne in base alla posizione (non per nome), seguendo il comportamento standard in SQL.

Examples

df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-19