pandas_api

既存の DataFrame を pandas-on-Spark DataFrame に変換します。

構文

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

パラメーター

パラメーター タイプ 説明
index_col str または str のリスト(省略可能) Spark のテーブルのインデックス列。

返品

PandasOnSparkDataFrame

メモ

pandas-on-Spark DataFrame が Spark DataFrame に変換され、pandas-on-Spark に戻ると、インデックス情報が失われ、元のインデックスが通常の列に変換されます。

これは、Pandas がインストールされ、使用可能な場合にのみ使用できます。

例示

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob