Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Calcola i valori medi per ogni colonna numerica per ogni gruppo.
mean è un alias per avg.
Sintassi
avg(*cols)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
cols |
str | Nomi di colonna. Le colonne non numeriche vengono ignorate. |
Restituzioni
DataFrame
Examples
df = spark.createDataFrame([
(2, "Alice", 80), (3, "Alice", 100),
(5, "Bob", 120), (10, "Bob", 140)], ["age", "name", "height"])
# Group-by name, and calculate the mean of the age in each group.
df.groupBy("name").avg('age').sort("name").show()
# +-----+--------+
# | name|avg(age)|
# +-----+--------+
# |Alice| 2.5|
# | Bob| 7.5|
# +-----+--------+
# Calculate the mean of the age and height in all data.
df.groupBy().avg('age', 'height').show()
# +--------+-----------+
# |avg(age)|avg(height)|
# +--------+-----------+
# | 5.0| 110.0|
# +--------+-----------+