Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Ungültig und aktualisiert alle zwischengespeicherten Daten (und die zugehörigen Metadaten) für jeden DataFrame, der den angegebenen Datenquellenpfad enthält.
Syntax
refreshByPath(path: str)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
path |
str | Der Pfad zum Aktualisieren des Caches. |
Beispiele
# The example below caches a table, and then removes the data.
import tempfile
with tempfile.TemporaryDirectory(prefix="refreshByPath") as d:
_ = spark.sql("DROP TABLE IF EXISTS tbl1")
_ = spark.sql(
"CREATE TABLE tbl1 (col STRING) USING TEXT LOCATION '{}'".format(d))
_ = spark.sql("INSERT INTO tbl1 SELECT 'abc'")
spark.catalog.cacheTable("tbl1")
spark.table("tbl1").show()
# +---+
# |col|
# +---+
# |abc|
# +---+
# Because the table is cached, it computes from the cached data as below.
spark.table("tbl1").count()
# 1
# After refreshing the table by path, it shows 0 because the data does not exist anymore.
spark.catalog.refreshByPath(d)
spark.table("tbl1").count()
# 0
_ = spark.sql("DROP TABLE tbl1")