Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Restituisce un nuovo dataframe senza colonne specificate. Si tratta di un no-op se lo schema non contiene i nomi di colonna specificati.
Sintassi
drop(*cols: "ColumnOrName")
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
cols |
str o Column | Nome della colonna o colonna da eliminare. |
Restituzioni
DataFrame: nuovo dataframe senza le colonne specificate.
Note
Quando un input è un nome di colonna, viene trattato letteralmente senza ulteriori interpretazioni. In caso contrario, tenterà di trovare la corrispondenza con l'espressione equivalente. Pertanto, l'eliminazione di una colonna in base al nome drop(colName) ha una semantica diversa con l'eliminazione diretta della colonna drop(col(colName)).
Examples
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+