Condividi tramite


cache

Rende persistente il dataframe con il livello di archiviazione predefinito (MEMORY_AND_DISK_DESER).

Sintassi

cache()

Restituzioni

DataFrame: dataframe memorizzato nella cache.

Note

Il livello di archiviazione predefinito è stato modificato in modo che corrisponda a MEMORY_AND_DISK_DESER Scala nella versione 3.0.

I dati memorizzati nella cache vengono condivisi in tutte le sessioni Spark nel cluster.

Examples

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...