Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Restituisce un nuovo dataframe aggiungendo una colonna o sostituendo la colonna esistente con lo stesso nome.
Sintassi
withColumn(colName: str, col: Column)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
colName |
str | stringa, nome della nuova colonna. |
col |
colonna | Espressione column per la nuova colonna. |
Restituzioni
DataFrame: dataframe con colonna nuova o sostituita.
Note
Questo metodo introduce una proiezione internamente. Pertanto, chiamandola più volte, ad esempio, tramite cicli per aggiungere più colonne possono generare grandi piani che possono causare problemi di prestazioni e anche StackOverflowException. Per evitare questo problema, usare select con più colonne contemporaneamente.
Examples
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+