Freigeben über


Vereinigung

Gibt einen neuen DataFrame zurück, der die Vereinigung von Zeilen in diesem und einem anderen DataFrame enthält.

Syntax

union(other: "DataFrame")

Parameter

Parameter Typ Beschreibung
other DataFrame Ein weiteres DataFrame, das unioniert werden muss.

Rückkehr

DataFrame: Ein neuer DataFrame, der die kombinierten Zeilen mit entsprechenden Spalten enthält.

Hinweise

Diese Methode führt eine SQL-Set-Vereinigung der Zeilen aus beiden DataFrame Objekten ohne automatische Deduplizierung von Elementen durch.

Verwenden Sie die distinct() Methode, um die Deduplizierung von Zeilen auszuführen.

Die Methode löst Spalten nach Position (nicht nach Name) nach dem Standardverhalten in SQL auf.

Beispiele

df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+