キャッシュ

既定のストレージ レベル (MEMORY_AND_DISK_DESER) で DataFrame を保持します。

構文

cache()

返品

DataFrame: キャッシュされたデータフレーム。

メモ

既定のストレージ レベルは、3.0 で Scala と一致するように MEMORY_AND_DISK_DESER に変更されました。

キャッシュされたデータは、クラスター上のすべての Spark セッションで共有されます。

例示

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...