Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gibt einen neuen DataFrame ohne angegebene Spalten zurück. Dies ist eine no-op, wenn das Schema nicht den angegebenen Spaltennamen enthält.
Syntax
drop(*cols: "ColumnOrName")
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
cols |
str oder Column | Ein Name der Spalte oder der spalte, die gelöscht werden soll. |
Rückkehr
DataFrame: Ein neues DataFrame ohne die angegebenen Spalten.
Hinweise
Wenn es sich bei einer Eingabe um einen Spaltennamen handelt, wird sie buchstäblich ohne weitere Interpretation behandelt. Andernfalls wird versucht, dem entsprechenden Ausdruck zu entsprechen. Das Ablegen einer Spalte mit seinem Namen drop(colName) hat also eine andere Semantik, mit der die Spalte drop(col(colName))direkt gelöscht wird.
Beispiele
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+