DataFrame内のすべての列の名前をリストとして取得します。 リスト内の列名の順序は、DataFrame の順序を反映します。
返品
list
例示
DataFrame の列名を取得します。
df = spark.createDataFrame(
[(14, "Tom", "CA"), (23, "Alice", "NY"), (16, "Bob", "TX")],
["age", "name", "state"]
)
df.columns
# ['age', 'name', 'state']
列名を使用して、特定の列を投影します。
selected_cols = [col for col in df.columns if col != "age"]
df.select(selected_cols).show()
# +-----+-----+
# | name|state|
# +-----+-----+
# | Tom| CA|
# |Alice| NY|
# | Bob| TX|
# +-----+-----+
DataFrame に特定の列が存在するかどうかを確認します。
"state" in df.columns
# True
"salary" in df.columns
# False