Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gibt einen neuen DataFrame zurück, der die Vereinigung von Zeilen in diesem und einem anderen DataFrame enthält.
Syntax
union(other: "DataFrame")
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
other |
DataFrame | Ein weiteres DataFrame, das unioniert werden muss. |
Rückkehr
DataFrame: Ein neuer DataFrame, der die kombinierten Zeilen mit entsprechenden Spalten enthält.
Hinweise
Diese Methode führt eine SQL-Set-Vereinigung der Zeilen aus beiden DataFrame Objekten ohne automatische Deduplizierung von Elementen durch.
Verwenden Sie die distinct() Methode, um die Deduplizierung von Zeilen auszuführen.
Die Methode löst Spalten nach Position (nicht nach Name) nach dem Standardverhalten in SQL auf.
Beispiele
df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+
df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+