drop (DataFrame)

指定した列を含まない新しい DataFrame を返します。 これは、スキーマに指定された列名が含まれていない場合の no-op です。

構文

drop(*cols: "ColumnOrName")

パラメーター

パラメーター タイプ 説明
cols str または Column 列の名前、または削除する列。

返品

DataFrame: 指定された列のない新しい DataFrame。

メモ

入力が列名の場合、それ以上の解釈を行わずに文字どおり処理されます。 それ以外の場合は、同等の式と一致しようとします。 そのため、 drop(colName) 名前で列を削除すると、列の drop(col(colName))を直接削除するというセマンティックが異なります。

例示

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14|    80|
# | 16|    85|
# +---+------+