comColuna

Devolve um novo DataFrame adicionando uma coluna ou substituindo a coluna existente com o mesmo nome.

Sintaxe

withColumn(colName: str, col: Column)

Parâmetros

Parâmetro Tipo Descrição
colName str string, nome da nova coluna.
col Coluna uma expressão em coluna para a nova coluna.

Devoluções

DataFrame: DataFrame com coluna nova ou substituída.

Notes

Este método introduz uma projeção internamente. Portanto, chamar-lhe várias vezes, por exemplo, via loops para adicionar múltiplas colunas pode gerar grandes planos que podem causar problemas de desempenho e até StackOverflowException. Para evitar isto, use select com várias colunas ao mesmo tempo.

Exemplos

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# |  2|Alice|   4|
# |  5|  Bob|   7|
# +---+-----+----+