Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Calcola la correlazione di due colonne di un dataframe come valore doppio. Attualmente supporta solo il coefficiente di correlazione di Pearson.
DataFrame.corr e DataFrameStatFunctions.corr sono alias l'uno dell'altro.
Sintassi
corr(col1: str, col2: str, method: Optional[str] = None)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
col1 |
str | Nome della prima colonna. |
col2 |
str | Nome della seconda colonna. |
method |
str, facoltativo | Metodo di correlazione. Attualmente supporta solo "pearson". |
Restituzioni
float: Coefficiente di correlazione di Pearson di due colonne.
Examples
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0