Condividi tramite


pandas_api

Converte il dataframe esistente in un dataframe pandas-on-Spark.

Sintassi

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

Parametri

Parametro Tipo Descrizione
index_col str o elenco di str, facoltativo Colonna indice della tabella in Spark.

Restituzioni

PandasOnSparkDataFrame

Note

Se un dataframe pandas-on-Spark viene convertito in un dataframe Spark e quindi torna a pandas-on-Spark, perderà le informazioni sull'indice e l'indice originale verrà trasformato in una colonna normale.

Questa opzione è disponibile solo se Pandas è installato e disponibile.

Examples

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob