Freigeben über


unionByName

Gibt einen neuen DataFrame zurück, der die Vereinigung von Zeilen in diesem und einem anderen DataFrame enthält.

Syntax

unionByName(other: "DataFrame", allowMissingColumns: bool = False)

Parameter

Parameter Typ Beschreibung
other DataFrame Ein weiterer DataFrame, der kombiniert werden muss.
allowMissingColumns bool, optional, default False Geben Sie an, ob fehlende Spalten zulässig sind.

Rückkehr

DataFrame: Ein neuer DataFrame, der die kombinierten Zeilen mit den entsprechenden Spalten der beiden angegebenen DataFrames enthält.

Hinweise

Diese Methode führt einen Union-Vorgang für beide Eingabedatenframes durch und löst Spalten nach Namen (anstelle der Position) auf. Wenn allowMissingColumns "True" ist, werden fehlende Spalten mit NULL gefüllt.

Beispiele

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col0"])
df1.unionByName(df2).show()
# +----+----+----+
# |col0|col1|col2|
# +----+----+----+
# |   1|   2|   3|
# |   6|   4|   5|
# +----+----+----+

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col3"])
df1.unionByName(df2, allowMissingColumns=True).show()
# +----+----+----+----+
# |col0|col1|col2|col3|
# +----+----+----+----+
# |   1|   2|   3|NULL|
# |NULL|   4|   5|   6|
# +----+----+----+----+