データ ソース内のデータセットに基づいてテーブルを作成します。
構文
createTable(tableName: str, path: str = None, source: str = None, schema: StructType = None, description: str = None, **options: str)
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
tableName |
str | 作成するテーブルの名前。 カタログ名で修飾できます。 |
path |
str、省略可能 | このテーブルのデータが存在するパス。
pathを指定すると、指定したパスにあるデータから外部テーブルが作成されます。 それ以外の場合は、マネージド テーブルが作成されます。 |
source |
str、省略可能 | このテーブルのソース ( 'parquet'、 'orc'など)。 source を指定しない場合は、 spark.sql.sources.default によって構成された既定のデータ ソースが使用されます。 |
schema |
StructType任意 |
このテーブルのスキーマ。 |
description |
str、省略可能 | この表の説明。 |
**options |
dict、省略可能 | テーブルで指定する追加のオプション。 |
返品
DataFrame
テーブルに関連付けられている DataFrame。
例示
# Creating a managed table.
_ = spark.catalog.createTable("tbl1", schema=spark.range(1).schema, source='parquet')
_ = spark.sql("DROP TABLE tbl1")
# Creating an external table.
import tempfile
with tempfile.TemporaryDirectory(prefix="createTable") as d:
_ = spark.catalog.createTable(
"tbl2", schema=spark.range(1).schema, path=d, source='parquet')
_ = spark.sql("DROP TABLE tbl2")