Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Devolve uma versão localmente checkpoint deste DataFrame. O checkpointing pode ser usado para truncar o plano lógico deste DataFrame, o que é especialmente útil em algoritmos iterativos onde o plano pode crescer exponencialmente. Os checkpoints locais são armazenados nos executores através do subsistema de cache e, por isso, não são fiáveis.
Sintaxe
localCheckpoint(eager: bool = True, storageLevel: Optional[StorageLevel] = None)
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
eager |
bool, opcional, por defeito True | Se deve verificar este DataFrame imediatamente. |
storageLevel |
StorageLevel, opcional, por defeito Nenhum | O StorageLevel com o qual o checkpoint será armazenado. Se não especificado, por defeito os pontos de controlo locais RDD. |
Devoluções
DataFrame: DataFrame Checkpoint.
Notes
Esta API é experimental.
Exemplos
df = spark.createDataFrame([
(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.localCheckpoint(False)
# DataFrame[age: bigint, name: string]