cache

Persiste o DataFrame com o nível de armazenamento predefinido (MEMORY_AND_DISK_DESER).

Sintaxe

cache()

Devoluções

DataFrame: DataFrame em cache.

Notes

O nível de armazenamento padrão mudou para MEMORY_AND_DISK_DESER corresponder ao Scala na 3.0.

Os dados em cache são partilhados por todas as sessões Spark no cluster.

Exemplos

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...