Freigeben über


pandas_api

Konvertiert den vorhandenen DataFrame in einen Pandas-on-Spark DataFrame.

Syntax

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

Parameter

Parameter Typ Beschreibung
index_col str oder liste von str, optional Indexspalte der Tabelle in Spark.

Rückkehr

PandasOnSparkDataFrame

Hinweise

Wenn ein Pandas-on-Spark DataFrame in einen Spark DataFrame konvertiert wird und dann zurück in Pandas-on-Spark, verliert er die Indexinformationen, und der ursprüngliche Index wird in eine normale Spalte umgewandelt.

Dies ist nur verfügbar, wenn Pandas installiert und verfügbar ist.

Beispiele

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob