Freigeben über


withColumn

Gibt einen neuen DataFrame zurück, indem eine Spalte hinzugefügt oder die vorhandene Spalte ersetzt wird, die denselben Namen hat.

Syntax

withColumn(colName: str, col: Column)

Parameter

Parameter Typ Beschreibung
colName str Zeichenfolge, Name der neuen Spalte.
col Kolumne ein Spaltenausdruck für die neue Spalte.

Rückkehr

DataFrame: DataFrame mit neuer oder ersetzter Spalte.

Hinweise

Diese Methode führt intern eine Projektion ein. Daher kann das Mehrfache aufrufen, z. B. über Schleifen, um mehrere Spalten hinzuzufügen, große Pläne generieren, die zu Leistungsproblemen und sogar zu StackOverflowExceptionLeistungsproblemen führen können. Um dies zu vermeiden, verwenden Sie die Verwendung select mit mehreren Spalten gleichzeitig.

Beispiele

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# |  2|Alice|   4|
# |  5|  Bob|   7|
# +---+-----+----+