Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gibt einen neuen DataFrame zurück, indem eine Spalte hinzugefügt oder die vorhandene Spalte ersetzt wird, die denselben Namen hat.
Syntax
withColumn(colName: str, col: Column)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
colName |
str | Zeichenfolge, Name der neuen Spalte. |
col |
Kolumne | ein Spaltenausdruck für die neue Spalte. |
Rückkehr
DataFrame: DataFrame mit neuer oder ersetzter Spalte.
Hinweise
Diese Methode führt intern eine Projektion ein. Daher kann das Mehrfache aufrufen, z. B. über Schleifen, um mehrere Spalten hinzuzufügen, große Pläne generieren, die zu Leistungsproblemen und sogar zu StackOverflowExceptionLeistungsproblemen führen können. Um dies zu vermeiden, verwenden Sie die Verwendung select mit mehreren Spalten gleichzeitig.
Beispiele
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+