Freigeben über


localCheckpoint

Gibt eine lokal überprüfte Version dieses DataFrame zurück. Prüfpunkte können verwendet werden, um den logischen Plan dieses DataFrames abzuschneiden, was besonders bei iterativen Algorithmen hilfreich ist, in denen der Plan exponentiell wachsen kann. Lokale Prüfpunkte werden in den Executoren mithilfe des Caching-Subsystems gespeichert und daher nicht zuverlässig.

Syntax

localCheckpoint(eager: bool = True, storageLevel: Optional[StorageLevel] = None)

Parameter

Parameter Typ Beschreibung
eager bool, optional, default True Gibt an, ob dieser DataFrame sofort überprüft werden soll.
storageLevel StorageLevel, optional, default None Der Speicherlevel, mit dem der Prüfpunkt gespeichert wird. Wenn nicht angegeben, wird die Standardeinstellung für lokale RDD-Prüfpunkte festgelegt.

Rückkehr

DataFrame: Prüfpunkted DataFrame.

Hinweise

Diese API ist experimentell.

Beispiele

df = spark.createDataFrame([
    (14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.localCheckpoint(False)
# DataFrame[age: bigint, name: string]