この DataFrame の内容を Pandas pandas.DataFrameとして返します。
構文
toPandas()
返品
pandas.DataFrame
メモ
このメソッドは、すべてのデータがドライバーのメモリに読み込まれるため、結果として得られる Pandas pandas.DataFrame が小さいと予想される場合にのみ使用する必要があります。
spark.sql.execution.arrow.pyspark.enabled=Trueでの使用は試験段階です。
これは、Pandas がインストールされ、使用可能な場合にのみ使用できます。
例示
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.toPandas()
# age name
# 0 2 Alice
# 1 5 Bob