Condividi tramite


union

Restituisce un nuovo dataframe contenente l'unione di righe in questo e un altro dataframe.

Sintassi

union(other: "DataFrame")

Parametri

Parametro Tipo Descrizione
other DataFrame Un altro dataframe che deve essere unito.

Restituzioni

DataFrame: nuovo dataframe contenente le righe combinate con le colonne corrispondenti.

Note

Questo metodo esegue un'unione di set in stile SQL delle righe di entrambi DataFrame gli oggetti, senza deduplicazione automatica degli elementi.

Utilizzare il distinct() metodo per eseguire la deduplicazione delle righe.

Il metodo risolve le colonne in base alla posizione (non per nome), seguendo il comportamento standard in SQL.

Examples

df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+