指定した列を含まない新しい DataFrame を返します。 これは、スキーマに指定された列名が含まれていない場合の no-op です。
構文
drop(*cols: "ColumnOrName")
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
cols |
str または Column | 列の名前、または削除する列。 |
返品
DataFrame: 指定された列のない新しい DataFrame。
メモ
入力が列名の場合、それ以上の解釈を行わずに文字どおり処理されます。 それ以外の場合は、同等の式と一致しようとします。 そのため、 drop(colName) 名前で列を削除すると、列の drop(col(colName))を直接削除するというセマンティックが異なります。
例示
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+