Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Erstellt eine Tabelle basierend auf dem Dataset in einer Datenquelle.
Syntax
createTable(tableName: str, path: str = None, source: str = None, schema: StructType = None, description: str = None, **options: str)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
tableName |
str | Name der zu erstellenden Tabelle. Kann mit Katalognamen qualifiziert werden. |
path |
str, optional | Der Pfad, in dem die Daten für diese Tabelle vorhanden sind. Wenn path angegeben, wird eine externe Tabelle aus den Daten im angegebenen Pfad erstellt. Andernfalls wird eine verwaltete Tabelle erstellt. |
source |
str, optional | Die Quelle dieser Tabelle, z 'parquet'. B. , 'orc'usw. Wenn source nicht angegeben, wird die standardmäßige Datenquelle verwendet, die von spark.sql.sources.default ihnen konfiguriert wird. |
schema |
StructTypewahlfrei |
Das Schema für diese Tabelle. |
description |
str, optional | Die Beschreibung dieser Tabelle. |
**options |
Diktat, optional | Zusätzliche Optionen, die in der Tabelle angegeben werden sollen. |
Rückkehr
DataFrame
Der DataFrame, der der Tabelle zugeordnet ist.
Beispiele
# Creating a managed table.
_ = spark.catalog.createTable("tbl1", schema=spark.range(1).schema, source='parquet')
_ = spark.sql("DROP TABLE tbl1")
# Creating an external table.
import tempfile
with tempfile.TemporaryDirectory(prefix="createTable") as d:
_ = spark.catalog.createTable(
"tbl2", schema=spark.range(1).schema, path=d, source='parquet')
_ = spark.sql("DROP TABLE tbl2")