保持

最初に計算された後に、操作間で DataFrame の内容を保持するようにストレージレベルを設定します。これは、DataFrame にストレージレベルがまだ設定されていない場合にのみ、新しいストレージレベルを割り当てるために使用できます。ストレージレベルが指定されていない場合、既定値は (MEMORY_AND_DISK_DESER)。

構文

persist(storageLevel: StorageLevel = StorageLevel.MEMORY_AND_DISK_DESER)

パラメーター

パラメーター	タイプ	説明
`storageLevel`	StorageLevel	永続化のために設定するストレージレベル。既定値は MEMORY_AND_DISK_DESER です。

返品

DataFrame: 永続化された DataFrame。

メモ

既定のストレージレベルは、3.0 で Scala と一致するように MEMORY_AND_DISK_DESER に変更されました。

キャッシュされたデータは、クラスター上のすべての Spark セッションで共有されます。

例示

df = spark.range(1)
df.persist()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...

from pyspark.storagelevel import StorageLevel
df.persist(StorageLevel.DISK_ONLY)
# DataFrame[id: bigint]

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-19

保持

構文

パラメーター

返品

メモ

例示

フィードバック

その他のリソース