この DataFrame のローカルチェックポイントバージョンを返します。 チェックポイント処理を使用すると、この DataFrame の論理プランを切り詰めることができます。これは、プランが指数関数的に増加する可能性がある反復アルゴリズムで特に便利です。 ローカル チェックポイントはキャッシュ サブシステムを使用して Executor に格納されるため、信頼できません。
構文
localCheckpoint(eager: bool = True, storageLevel: Optional[StorageLevel] = None)
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
eager |
bool、省略可能、既定値 True | この DataFrame をすぐにチェックポイント処理するかどうかを指定します。 |
storageLevel |
StorageLevel、省略可能、既定値なし | チェックポイントを格納する StorageLevel。 指定しない場合、RDD ローカル チェックポイントの既定値。 |
返品
DataFrame: チェックポイント処理されたデータフレーム。
メモ
この API は試験段階です。
例示
df = spark.createDataFrame([
(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.localCheckpoint(False)
# DataFrame[age: bigint, name: string]