Freigeben über


drop (DataFrame)

Gibt einen neuen DataFrame ohne angegebene Spalten zurück. Dies ist eine no-op, wenn das Schema nicht den angegebenen Spaltennamen enthält.

Syntax

drop(*cols: "ColumnOrName")

Parameter

Parameter Typ Beschreibung
cols str oder Column Ein Name der Spalte oder der spalte, die gelöscht werden soll.

Rückkehr

DataFrame: Ein neues DataFrame ohne die angegebenen Spalten.

Hinweise

Wenn es sich bei einer Eingabe um einen Spaltennamen handelt, wird sie buchstäblich ohne weitere Interpretation behandelt. Andernfalls wird versucht, dem entsprechenden Ausdruck zu entsprechen. Das Ablegen einer Spalte mit seinem Namen drop(colName) hat also eine andere Semantik, mit der die Spalte drop(col(colName))direkt gelöscht wird.

Beispiele

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14|    80|
# | 16|    85|
# +---+------+