Condividi tramite


withColumn

Restituisce un nuovo dataframe aggiungendo una colonna o sostituendo la colonna esistente con lo stesso nome.

Sintassi

withColumn(colName: str, col: Column)

Parametri

Parametro Tipo Descrizione
colName str stringa, nome della nuova colonna.
col colonna Espressione column per la nuova colonna.

Restituzioni

DataFrame: dataframe con colonna nuova o sostituita.

Note

Questo metodo introduce una proiezione internamente. Pertanto, chiamandola più volte, ad esempio, tramite cicli per aggiungere più colonne possono generare grandi piani che possono causare problemi di prestazioni e anche StackOverflowException. Per evitare questo problema, usare select con più colonne contemporaneamente.

Examples

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# |  2|Alice|   4|
# |  5|  Bob|   7|
# +---+-----+----+