ウィンドウの指定を列に適用します。
構文
over(window)
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
window |
WindowSpec | ウィンドウの仕様 |
返品
コラム
例示
from pyspark.sql import Window
from pyspark.sql.functions import rank, min, desc
window = (
Window.partitionBy("name")
.orderBy("age")
.rowsBetween(Window.unboundedPreceding, Window.currentRow)
)
df = spark.createDataFrame(
[(2, "Alice"), (5, "Bob")], ["age", "name"])
df.withColumn(
"rank", rank().over(window)
).withColumn(
"min", min('age').over(window)
).sort(desc("age")).show()
# +---+-----+----+---+
# |age| name|rank|min|
# +---+-----+----+---+
# | 5| Bob| 1| 5|
# | 2|Alice| 1| 2|
# +---+-----+----+---+