Condividi tramite


drop (DataFrame)

Restituisce un nuovo dataframe senza colonne specificate. Si tratta di un no-op se lo schema non contiene i nomi di colonna specificati.

Sintassi

drop(*cols: "ColumnOrName")

Parametri

Parametro Tipo Descrizione
cols str o Column Nome della colonna o colonna da eliminare.

Restituzioni

DataFrame: nuovo dataframe senza le colonne specificate.

Note

Quando un input è un nome di colonna, viene trattato letteralmente senza ulteriori interpretazioni. In caso contrario, tenterà di trovare la corrispondenza con l'espressione equivalente. Pertanto, l'eliminazione di una colonna in base al nome drop(colName) ha una semantica diversa con l'eliminazione diretta della colonna drop(col(colName)).

Examples

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14|    80|
# | 16|    85|
# +---+------+