既定のストレージ レベル (MEMORY_AND_DISK_DESER) で DataFrame を保持します。
構文
cache()
返品
DataFrame: キャッシュされたデータフレーム。
メモ
既定のストレージ レベルは、3.0 で Scala と一致するように MEMORY_AND_DISK_DESER に変更されました。
キャッシュされたデータは、クラスター上のすべての Spark セッションで共有されます。
例示
df = spark.range(1)
df.cache()
# DataFrame[id: bigint]
df.explain()
# == Physical Plan ==
# InMemoryTableScan ...