CREATE TABLE [使用中]

適用対象: チェックマーク付き: はい Databricks SQL Databricks Runtime

マネージドテーブル、一時テーブル、または外部テーブルを定義し、必要に応じてデータソースを使用して非一時テーブルを定義します。

CREATE TEMP TABLE コマンドは、セッション中にデータを一時的に保持するセッションローカル一時テーブルを作成します。テーブル名は非修飾にする必要があります (スキーマまたはカタログプレフィックスはありません)。一時テーブルは現在のスキーマまたはカタログには存在せず、作成したセッション内でのみアクセスできます。 Databricks は、セッションの終了時に一時テーブルを自動的に削除します。

構文

{ { [CREATE OR] REPLACE { TEMP | TEMPORARY } TABLE | CREATE [EXTERNAL] TABLE [ IF NOT EXISTS ] | CREATE { TEMP | TEMPORARY } TABLE}
  table_name
  [ table_specification ]
  [ USING data_source ]
  [ table_clauses ]
  [ AS query ] }

table_specification
  ( { column_identifier column_type [ column_properties ] } [, ...]
    [ , table_constraint ] [...] )

column_properties
  { NOT NULL |
    COLLATE collation_name |
    GENERATED ALWAYS AS ( expr ) |
    GENERATED { ALWAYS | BY DEFAULT } AS IDENTITY [ ( [ START WITH start | INCREMENT BY step ] [ ...] ) ] |
    DEFAULT default_expression |
    COMMENT column_comment |
    column_constraint |
    MASK clause } [ ... ]

table_clauses
  { OPTIONS clause |
    PARTITIONED BY clause |
    CLUSTER BY clause |
    clustered_by_clause |
    LOCATION path [ WITH ( CREDENTIAL credential_name ) ] |
    COMMENT table_comment |
    TBLPROPERTIES clause |
    DEFAULT COLLATION default_collation_name |
    WITH { ROW FILTER clause } } [...]

clustered_by_clause
  { CLUSTERED BY ( cluster_column [, ...] )
    [ SORTED BY ( { sort_column [ ASC | DESC ] } [, ...] ) ]
    INTO num_buckets BUCKETS }

Databricks Runtime 16.1 より前の START WITH は、INCREMENT BYの前に置く必要があります。

パラメーター

取り替える

指定した場合は、テーブルとその内容が既に存在する場合に置き換えられます。この句は、Delta テーブルと Apache Iceberg テーブルでのみサポートされます。

REPLACE では、テーブル履歴が保持され、権限、行フィルター、列マスクが付与されます。

メモ

Azure Databricksテーブルを削除して再作成するのではなく、REPLACEを使用することを強くお勧めします。
外部

指定した場合は、外部テーブルを作成します。外部テーブルを作成するときは、LOCATION 句も指定する必要があります。外部テーブルが削除されても、LOCATION のファイルは削除されません。
TEMP または TEMPORARY

適用対象: Databricks SQL

Important

この機能はパブリックプレビュー段階です。

指定すると、一時テーブルが作成または置換されます。一時テーブルを作成または置換するときは、 USING 句または LOCATION 句でデータソースを指定しないでください。次の句はサポートされていません: PARTITIONED BY、 CLUSTER BY、行レベルのフィルター。次の列プロパティはサポートされていません: GENERATED と列マスク。

REPLACE コマンドの場合、 TEMPORARY キーワードが指定されていない場合、コマンドは永続テーブルのみを置き換えます。同じ修飾されていない名前の一時テーブルが存在する場合、 TEMP_TABLE_REPLACE_PERMANENT_NAME_CONFLICT エラーが生成されます。
存在しない場合

指定した場合、同じ名前のテーブルが既に存在すると、ステートメントは無視されます。

IF NOT EXISTS は REPLACE と共存できません。つまり、CREATE OR REPLACE TABLE IF NOT EXISTS は許可されません。
table_name

作成されるテーブルの名前。名前には、テンポラル仕様またはオプション指定を含めてはなりません。名前が修飾されていない場合、テーブルは現在のスキーマに作成されます。

hive_metastoreで作成されたテーブルには、英数字の ASCII 文字とアンダースコア (INVALID_SCHEMA_OR_RELATION_NAME) のみを含めることができます。

Iceberg テーブルは Unity カタログで作成する必要があります。 hive_metastoreでの Iceberg テーブルの作成はサポートされていません。

一時テーブルを作成するときは、非修飾名 (カタログまたはスキーマなし) を使用します。一時テーブルまたはビューの名前が永続的オブジェクトと同じである場合、非修飾名は一時オブジェクトを参照します。カタログまたはスキーマを含む修飾名を使用して永続的オブジェクトにアクセスします。詳細については、「テーブルとビューの解像度」を参照してください。

テーブル仕様

この省略可能な句で、列、その型、プロパティ、説明、および列制約の一覧を定義します。

テーブルスキーマで列を定義しない場合は、AS query または LOCATION のいずれかを指定する必要があります。
- column_identifier
  
  列の一意の名前。
  
  列マッピングプロパティ ('delta.columnMapping.mode' = 'name') のない Delta テーブルの列識別子には、スペースまたは次の文字を含めることはできません: , ; { } ( ) \n \t = 。
  
  AVROテーブルの列識別子は、アンダースコア (_) または Unicode 文字 (非 ASCII 文字を含む) で始まり、その後に Unicode 文字、数字、アンダースコアの組み合わせが続く必要があります。
  
  ICEBERG テーブルの列識別子は、一意で大文字と小文字を区別せず、標準の SQL 識別子規則に従う必要があります。スペースまたは特殊文字は、すべてのクエリエンジンでサポートされていない可能性があるため、使用しないでください。
- カラムタイプ (column_type)
  
  列のデータ型を指定します。 Azure Databricksでサポートされているすべてのdata 型が、すべてのデータソースでサポートされているわけではありません。
- NOT NULL
  
  指定した場合、列は NULL 値を受け入れられません。この句は、Delta テーブルと Iceberg テーブルでのみサポートされます。
- COLLATE collation_name
  
  適用対象: Databricks SQL Databricks Runtime 16.1 以上
  
  STRING column_type の場合は、必要に応じて、この列の比較および並べ替え操作に適用する照合順序に名前を付けます。既定の照合順序は、テーブル default_collation_nameです。
- 常に自動生成 ( expr )
  
  この句を指定すると、この列の値は、指定した expr によって決定されます。
  
  テーブルの DEFAULT COLLATION は UTF8_BINARYする必要があります。
  
  expr は、以下のものを除く、リテラル、テーブル内の列識別子、および決定論的な組み込みの SQL 関数または演算子で構成される場合があります。
  - 集計関数
  - 分析ウィンドウ関数
  - ランク付けウィンドウ関数
  - テーブル値ジェネレーター関数
  - UTF8_BINARY 以外の照合順序を持つ列
  また、exprにはサブクエリを含めてはなりません。
- GENERATED { ALWAYS |既定 } AS IDENTITY [ ( [ START WITH start ] [ INCREMENT BY step ] ) ] ]
  
  適用対象: Databricks SQL Databricks Runtime 10.4 LTS 以上
  
  ID 列を定義します。テーブルへの書き込み時に ID 列の値を指定しなかった場合は、統計的に増加する (または step が負の場合は減少する) 一意の値が自動的に割り当てられます。この句は、Delta テーブルでのみサポートされます。この句は、BIGINT データ型の列にのみ使用できます。
  
  自動的に割り当てられた値は、start から始まり、step ずつ増えます。割り当てられた値は一意ですが、連続している保証はありません。どちらのパラメーターも省略可能で、既定値は 1 です。 step に 0 は指定できません。
  
  自動的に割り当てられた値が ID 列の型の範囲を超える場合、クエリは失敗します。
  
  ALWAYS を使用する場合は、ID 列に独自の値を指定できません。
  
  次の操作はサポートされていません。
  - ID 列の PARTITIONED BY を行う
  - ID 列の UPDATE を行う
  メモ
  
  テーブルで ID 列を宣言すると、同時実行トランザクションが無効になります。 ID 列は、ターゲットテーブルへの同時書き込みが不要なユースケースでのみ使用してください。
- デフォルトデフォルト式
  
  適用対象: Databricks SQL Databricks Runtime 11.3 LTS以上
  
  列が指定されていない場合に DEFAULT、INSERT、UPDATE で使われる列の MERGE ... INSERT 値を定義します。
  
  既定値が指定されていない場合、Null 許容列には DEFAULT NULL が適用されます。
  
  default_expression は、リテラル、および組み込みの SQL 関数か演算子で構成することができます。ただし、次のものは除きます。
  - 集計関数
  - 分析ウィンドウ関数
  - ランク付けウィンドウ関数
  - テーブル値ジェネレーター関数
  また、default_expressionにはサブクエリを含めてはなりません。
  
  DEFAULT は CSV、JSON、PARQUET、と ORC ソースでサポートされています。
- コメント column_comment
  
  列について説明する文字列リテラル。
- column_constraint
  
  テーブル内の列に主キー制約または外部キー制約を追加します。
  
  制約は、hive_metastore カタログ内のテーブルではサポートされていません。
  
  テーブルに check 制約を追加するには、 ALTER TABLEを使用します。
- MASK 句
  
  適用対象: Databricks SQL
  
  列マスク関数を追加して、機密データを匿名化します。その列の後続のすべてのクエリは、列の元の値の代わりに、その列に対してその関数を評価した結果を受け取ります。これは、関数が呼び出し元ユーザーの ID またはグループメンバーシップを検査して、値を編集するかどうかを決定できる、きめ細かいアクセス制御に役立ちます。
  
  テーブルを置き換え、新しいテーブルに元の列と同じ列名が含まれている場合、既存の列マスクは明示的に再定義されていなくても保持されます。これにより、データアクセスポリシーが誤って失われるのを防ぐことができます。
- テーブル制約
  
  情報主キー制約または情報外部キー制約をテーブルに追加します。
  
  主な制約は、hive_metastore カタログ内のテーブルに対してはサポートされません。
  
  テーブルに check 制約を追加するには、 ALTER TABLEを使用します。
data_sourceの使用

data_source には、ファイル形式またはフェデレーション JDBC データソースのいずれかを指定できます。

ファイル形式は、次のいずれかである必要があります。
- AVRO
- BINARYFILE
- CSV
- DELTA
- ICEBERG
- JSON
- ORC
- PARQUET
- TEXT
DELTAまたはICEBERG以外のファイル形式の場合は、テーブルカタログがLOCATIONされていない限り、hive_metastoreも指定する必要があります。

次のフェデレーション JDBC ソースがサポートされています。
- POSTGRESQL
- SQLSERVER
- MYSQL
- BIGQUERY
- NETSUITE
- ORACLE
- REDSHIFT
- SNOWFLAKE
- SQLDW
- SYNAPSE
- SALESFORCE
- SALESFORCE_DATA_CLOUD
- TERADATA
- WORKDAY_RAAS
- MONGODB
フェデレーション JDBC ソースを指定する場合は、必要な接続情報を含む OPTIONS 句も指定する必要があります。フェデレーションデータソースのクエリの詳細については、 JDBC を使用したデータベースのクエリを参照してください。

テーブルに使用する次の追加のファイル形式が Databricks Runtime でサポートされています。
- JDBC
- LIBSVM
- org.apache.spark.sql.sources.DataSourceRegister のカスタム実装の完全修飾クラス名。
USING を省略した場合、既定値は DELTA です。

USING句は、一時テーブルではサポートされていません。

以下の適用対象: Databricks Runtime

HIVE は Databricks Runtime で Hive SerDe テーブルを作成するためにサポートされています。 Hive 固有の file_format や row_format を、OPTIONS 句を使用して指定できます。これは、大文字と小文字を区別しない文字列マップです。 option_keys は次のとおりです。
- FILEFORMAT
- INPUTFORMAT
- OUTPUTFORMAT
- SERDE
- FIELDDELIM
- ESCAPEDELIM
- MAPKEYDELIM
- LINEDELIM
テーブル条項

必要に応じて、新しいテーブルの場所、パーティション分割、クラスタリング、オプション、コメント、およびユーザー定義のプロパティを指定します。各サブ句は、1 回だけ指定できます。
- パーティション分割基準
  
  列のサブセットによってテーブルをパーティション分割する省略可能な句。
  
  PARTITIONED BY句は、一時テーブルではサポートされていません。
  
  メモ
  
  管理された Iceberg テーブルの場合、Azure Databricksは PARTITIONED BY をサポートしていません。代わりに、液体クラスタリング (CLUSTER BY) を使用してデータレイアウトを最適化します。デルタテーブルの場合、テーブル定義を省略した場合、Azure Databricksは、列の指定で前に列を一覧表示した場合でも、テーブルの末尾にパーティション分割列を配置します。
- CLUSTER BY
  
  適用対象: Databricks SQL Databricks Runtime 13.3 以降
  
  列のサブセットによって Delta テーブルまたは Iceberg テーブルをクラスター化する省略可能な句。表に液体クラスタリングを使用するを参照してください。他のテーブルをクラスター化するには、 clustered_by_clauseを使用します。
  
  Iceberg テーブルの場合、 CLUSTER BYを使用するときは、削除ベクトルと行 ID を明示的に無効にする必要があります。
  
  CLUSTER BY AUTOで自動液体クラスタリングを使用し、Databricks はクエリのパフォーマンスを最適化するためにクラスタリングキーをインテリジェントに選択します。
  
  液体クラスタリングを PARTITIONED BYと組み合わせることはできません。
- clustered_by_clause
  
  必要に応じて、列のサブセットを使用して、テーブルまたは各パーティションを固定数のハッシュバケットにクラスター化します。
  
  この句は、Delta テーブルまたは Iceberg テーブルではサポートされていません。 CLUSTER BY を代わりに使用します。
  - クラスタ化基準：
    
    各パーティション (パーティション分割が指定されていない場合は、テーブル) のクラスター化に使用する列のセットを指定します。
    - cluster_column
      
      テーブル内の column_identifier を参照する識別子。複数の列を指定する場合は、重複しないようにする必要があります。クラスタリングはパーティションレベルで動作するため、パーティション列をクラスター列として指定しないでください。
      
      CLUSTERED BY句は、一時テーブルではサポートされていません。
  - ソート順
    
    必要に応じて、バケット内の行の並べ替え順序を維持します。
    - sort_column
      
      バケットの並べ替えに使用する列。この列をパーティション列にすることはできません。並べ替え列は一意である必要があります。
    - ASC または DESC
      
      必要に応じて、sort_column の並べ替えを昇順 (ASC) にするか、降順 (DESC) にするかを指定します。既定値は ASC です。
  - INTO num_buckets BUCKETS
    
    各パーティション (またはパーティション分割が指定されていない場合はテーブル) が分割される分のバケット数を指定する INTEGER リテラル。
- LOCATION パス [ WITH ( CREDENTIAL credential_name ) ]
  
  テーブルデータが格納されているディレクトリへの省略可能なパス。これは、分散ストレージ上のパスにすることもできます。 path は文字列リテラルである必要があります。場所を指定しない場合、テーブルは managed table と見なされ、既定のテーブルの場所Azure Databricks作成されます。
  
  場所を指定すると、テーブルが外部テーブルになります。
  
  hive_metastore カタログに存在しないテーブルの場合、有効なpathが指定されていない限り、テーブルは外部の場所で保護する必要があります。
  
  マネージドテーブルの場所と重複する場所に外部テーブルを作成することはできません。
  
  Delta テーブルの場合、データがそのパスに既に存在する場合、テーブルは LOCATION からその構成を継承します。その結果、指定した TBLPROPERTIES、 table_specification、または PARTITIONED BY 句は、Delta の場所にある既存のデータと完全に一致する必要があります。
  
  Iceberg テーブルの場合、 LOCATION 句はサポートされていません。外部カタログを作成すると、外部 Iceberg テーブルが自動的に登録されるため、場所を指定せずに管理された Iceberg テーブルを作成する必要があります。
  
  LOCATION句は、一時テーブルではサポートされていません。
- オプション
  
  1 つ以上のユーザー定義テーブルオプションを設定またはリセットします。
- コメント table_comment
  
  テーブルについて説明する文字列リテラル。
- TBLPROPERTIES
  
  必要に応じて、1 つ以上のユーザー定義プロパティを設定します。
- デフォルトの照合順序 default_collation_name
  
  適用対象: Databricks SQL Databricks Runtime 16.3 以降
  
  使用する既定の照合順序を定義します。
  - STRING テーブルの列と項目
  - DEFAULT 式
  - CREATE TABLE AS query の本文
  CHECK 制約と生成される列式には、 UTF8_BINARYの既定の照合順序が必要です。
  
  指定しない場合、既定の照合順序は、テーブルが作成されるスキーマから派生します。
- WITH ROW FILTER 句
  
  適用対象: Databricks SQL
  
  行フィルター関数をテーブルに追加します。そのテーブルからの後続のすべてのクエリは、関数がブール値 TRUE に評価される行のサブセットを受け取ります。これは、関数が呼び出したユーザーの ID またはグループメンバーシップを検査して、特定の行をフィルター処理するかどうかを決定できる、きめ細かいアクセス制御に役立ちます。
  
  テーブルを置き換える場合、既存の行フィルターは、明示的に再定義されていなくても保持されます。これにより、データアクセスポリシーが誤って失われるのを防ぐことができます。
  
  ROW FILTER句は、一時テーブルではサポートされていません。

AS クエリ

この省略可能な句により、query からのデータを使用してテーブルが事前設定されます。 query を指定する場合は、table_specification も指定することはしないでください。テーブルスキーマはクエリから生成されます。

基になるデータソースを入力クエリのデータで上書きAzure Databricks、テーブルが作成され、入力クエリとまったく同じデータが含まれていることを確認します。

例示

-- Creates a Delta table
> CREATE TABLE student (id INT, name STRING, age INT);

-- Creates a managed Iceberg table
> CREATE TABLE edu.enrollment.student (id INT, name STRING, age INT) USING ICEBERG;

-- Use data from another table
> CREATE TABLE student_copy AS SELECT * FROM student;

-- Creates a CSV table from an external directory
> CREATE TABLE student USING CSV LOCATION '/path/to/csv_files';

-- Specify table comment and properties
> CREATE TABLE student (id INT, name STRING, age INT)
    COMMENT 'this is a comment'
    TBLPROPERTIES ('foo'='bar');

-- Specify table comment and properties with different clauses order
> CREATE TABLE student (id INT, name STRING, age INT)
    TBLPROPERTIES ('foo'='bar')
    COMMENT 'this is a comment';

-- Create partitioned table
> CREATE TABLE student (id INT, name STRING, age INT)
    PARTITIONED BY (age);

-- Create a table with a generated column
> CREATE TABLE rectangles(a INT, b INT,
                          area INT GENERATED ALWAYS AS (a * b));

-- Create a table with a string column with a case-insensitive collation.
> CREATE TABLE names(name STRING COLLATE UNICODE_CI);

-- Create a table with a default collation and override for a specific column.
> CREATE TABLE names(name STRING, first_name STRING, id STRING COLLATE UTF8_BINARY) DEFAULT COLLATION UNICODE_CI;

-- Create an external table connected to Oracle
> CREATE TABLE IF NOT EXISTS ora_tab
  USING ORACLE
  OPTIONS (
    url '<jdbc-url>',
    dbtable '<table-name>',
    user '<username>',
    password '<password>'
);

> SELECT * FROM ora_tab;

-- Create a temporary table, insert values in it, and display its contents.
> CREATE TEMP TABLE temp_1 (a INT);
> INSERT INTO temp_1 VALUES (1);
> SELECT * FROM temp_1;
  a
  ----
  1

> CREATE OR REPLACE TEMP TABLE temp_1 (a VARCHAR(100));
> DESCRIBE TABLE temp_1;
colName     dataType
—------     —-------
      a   varchar(100)

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-09

CREATE TABLE [使用中]

構文

パラメーター

例示

関連記事

フィードバック

その他のリソース