Freigeben über


Kontrollpunkt

Gibt eine prüfpunktierte Version dieses DataFrame zurück. Prüfpunkte können verwendet werden, um den logischen Plan dieses DataFrames abzuschneiden, was besonders bei iterativen Algorithmen hilfreich ist, in denen der Plan exponentiell wachsen kann. Sie wird in Dateien im Prüfpunktverzeichnis gespeichert, das mit SparkContext.setCheckpointDiroder mit der spark.checkpoint.dir Konfiguration festgelegt ist.

Syntax

checkpoint(eager: bool = True)

Parameter

Parameter Typ Beschreibung
eager bool, optional, default True Gibt an, ob dieser DataFrame sofort überprüft werden soll.

Rückkehr

DataFrame: Prüfpunkted DataFrame.

Hinweise

Diese API ist experimentell.

Beispiele

df = spark.createDataFrame([
    (14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.checkpoint(False)
# DataFrame[age: bigint, name: string]