既存の DataFrame を pandas-on-Spark DataFrame に変換します。
構文
pandas_api(index_col: Optional[Union[str, List[str]]] = None)
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
index_col |
str または str のリスト(省略可能) | Spark のテーブルのインデックス列。 |
返品
PandasOnSparkDataFrame
メモ
pandas-on-Spark DataFrame が Spark DataFrame に変換され、pandas-on-Spark に戻ると、インデックス情報が失われ、元のインデックスが通常の列に変換されます。
これは、Pandas がインストールされ、使用可能な場合にのみ使用できます。
例示
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.pandas_api()
# age name
# 0 14 Tom
# 1 23 Alice
# 2 16 Bob
df.pandas_api(index_col="age")
# name
# age
# 14 Tom
# 23 Alice
# 16 Bob