ponto de verificação

Devolve uma versão checkpoint deste DataFrame. O checkpointing pode ser usado para truncar o plano lógico deste DataFrame, o que é especialmente útil em algoritmos iterativos onde o plano pode crescer exponencialmente. Será guardado em ficheiros dentro do diretório checkpoint definido com SparkContext.setCheckpointDir, ou spark.checkpoint.dir configuração.

Sintaxe

checkpoint(eager: bool = True)

Parâmetros

Parâmetro Tipo Descrição
eager bool, opcional, por defeito True Se deve verificar este DataFrame imediatamente.

Devoluções

DataFrame: DataFrame Checkpoint.

Notes

Esta API é experimental.

Exemplos

df = spark.createDataFrame([
    (14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.checkpoint(False)
# DataFrame[age: bigint, name: string]