punto di controllo

Restituisce una versione con checkpoint di questo dataframe. Il checkpoint può essere usato per troncare il piano logico di questo dataframe, particolarmente utile negli algoritmi iterativi in cui il piano può crescere in modo esponenziale. Verrà salvato nei file all'interno della directory del checkpoint impostata con SparkContext.setCheckpointDiro spark.checkpoint.dir .

Sintassi

checkpoint(eager: bool = True)

Parametri

Parametro	Tipo	Descrizione
`eager`	bool, facoltativo, true predefinito	Indica se eseguire immediatamente il checkpoint di questo dataframe.

Restituzioni

DataFrame: dataframe con checkpoint.

Note

Questa API è sperimentale.

Examples

df = spark.createDataFrame([
    (14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.checkpoint(False)
# DataFrame[age: bigint, name: string]

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-19