Freigeben über


Summe (GroupedData)

Berechnet die Summe für jede numerische Spalte für jede Gruppe.

Syntax

sum(*cols)

Parameter

Parameter Typ Beschreibung
cols str Spaltennamen. Nicht numerische Spalten werden ignoriert.

Rückkehr

DataFrame

Beispiele

df = spark.createDataFrame([
    (2, "Alice", 80), (3, "Alice", 100),
    (5, "Bob", 120), (10, "Bob", 140)], ["age", "name", "height"])

# Group-by name, and calculate the sum of the age in each group.
df.groupBy("name").sum("age").sort("name").show()
# +-----+--------+
# | name|sum(age)|
# +-----+--------+
# |Alice|       5|
# |  Bob|      15|
# +-----+--------+

# Calculate the sum of the age and height in all data.
df.groupBy().sum("age", "height").show()
# +--------+-----------+
# |sum(age)|sum(height)|
# +--------+-----------+
# |      20|        440|
# +--------+-----------+