Freigeben über


Spalten

Ruft die Namen aller Spalten in der DataFrame Liste ab. Die Reihenfolge der Spaltennamen in der Liste spiegelt ihre Reihenfolge im DataFrame wider.

Rückkehr

list

Beispiele

Abrufen von Spaltennamen eines DataFrames.

df = spark.createDataFrame(
    [(14, "Tom", "CA"), (23, "Alice", "NY"), (16, "Bob", "TX")],
    ["age", "name", "state"]
)
df.columns
# ['age', 'name', 'state']

Verwenden Sie Spaltennamen, um bestimmte Spalten zu projizieren.

selected_cols = [col for col in df.columns if col != "age"]
df.select(selected_cols).show()
# +-----+-----+
# | name|state|
# +-----+-----+
# |  Tom|   CA|
# |Alice|   NY|
# |  Bob|   TX|
# +-----+-----+

Überprüfen Sie, ob eine bestimmte Spalte in einem DataFrame vorhanden ist.

"state" in df.columns
# True
"salary" in df.columns
# False