列の値が値の一覧に含まれているかどうかを確認します。
構文
isin(*cols)
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
cols |
values | チェック対象の値の一覧 |
返品
列 (ブール値)
例示
例 1: 指定した値の名前を持つ行をフィルター処理します。
df = spark.createDataFrame([(2, "Alice"), (5, "Bob"), (8, "Mike")], ["age", "name"])
df[df.name.isin("Bob", "Mike")].orderBy("age").show()
# +---+----+
# |age|name|
# +---+----+
# | 5| Bob|
# | 8|Mike|
# +---+----+
例 2: 指定したリストの年齢の行をフィルター処理します。
df[df.age.isin([1, 2, 3])].show()
# +---+-----+
# |age| name|
# +---+-----+
# | 2|Alice|
# +---+-----+
例 3: 指定した値にない名前の行をフィルター処理します。
df[~df.name.isin("Alice", "Bob")].show()
# +---+----+
# |age|name|
# +---+----+
# | 8|Mike|
# +---+----+
例 4: IN サブクエリとして DataFrame を使用する。
df.where(df.age.isin(spark.range(6))).orderBy("age").show()
# +---+-----+
# |age| name|
# +---+-----+
# | 2|Alice|
# | 5| Bob|
# +---+-----+