サーバーレスパイプラインを構成する

このページでは、サーバーレスパイプラインの構成について説明します。

Databricks では、サーバーレスを使用して新しいパイプラインを開発することをお勧めします。一部のワークロードでは、クラシックコンピューティングの構成または従来の Hive メタストアの操作が必要になる場合があります。「パイプラインのクラシックコンピューティングを構成する」と「従来の Hive メタストアで Lakeflow Spark 宣言パイプラインを使用する」を参照してください。

注

サーバーレスパイプラインでは、常に Unity カタログが使用されます。「パイプラインで Unity カタログを使用する」を参照してください。
サーバーレスコンピューティングの制限事項については、サーバーレスコンピューティングの制限を参照してください。
サーバーレスパイプラインの JSON 構成の clusters オブジェクトにコンピューティング設定を手動で追加することはできません。この操作を行おうとすると、エラーが発生します。

サーバーレスの Lakeflow Spark 宣言パイプラインとのAzure Private Link接続を使用する必要がある場合は、Databricks の担当者にお問い合わせください。

Requirements

サーバーレスパイプラインを使用するには、ワークスペースで Unity カタログが有効になっている必要があります。

ワークスペースは、サーバーレス対応リージョン内に存在する必要があります。

サーバーレスパイプラインの推奨される構成

Important

サーバーレスパイプラインを構成するためにクラスター作成アクセス許可は必要ありません。既定では、すべてのワークスペースユーザーはサーバーレスパイプラインを使用できます。

サーバーレスパイプラインでは、Azure Databricks がすべてのインフラストラクチャを管理するため、ほとんどの構成オプションが除外されます。新しいパイプラインを作成する場合、既定ではサーバーレスが使用されます。サーバーレスパイプラインを構成する方法については、「パイプラインの構成」を参照してください。

Unity カタログで構成された既存のパイプラインをサーバーレスを使用するように変換することもできます。サーバーレスを使用するには、既存のパイプラインを変換するを参照してください。

その他の構成に関する考慮事項

サーバーレスパイプラインでは、次の構成オプションも使用できます。

運用環境でパイプラインを実行するときに、 Continuous パイプラインモードを使用することもできます。トリガーされたパイプラインモードと継続的パイプラインモードを参照してください。
成功または失敗の条件に基づいて電子メールの更新に Notifications を追加します。パイプラインイベントの電子メール通知の追加を参照してください。
Configuration フィールドを使用して、パイプラインのキーと値のペアを設定します。これらの構成は、次の 2 つの目的に役立ちます。
- ソースコードで参照できる任意のパラメーターを設定します。「パイプラインでパラメーターを使用する」を参照してください。
- パイプライン設定と Spark 構成を構成します。パイプラインのプロパティのリファレンスを参照してください。
プレビュー チャネルを使用して、保留中の Lakeflow Spark 宣言パイプラインランタイムの変更と新しい機能の試用に対してパイプラインをテストします。

サーバーレス使用ポリシー

Important

この機能はパブリックプレビュー段階です。

サーバーレス使用ポリシーを使用すると、組織は、詳細な課金属性のために、サーバーレスの使用状況にカスタムタグを適用できます。 [サーバーレス] チェックボックスをオンにすると、パイプラインに適用するポリシーを選択できる Budget ポリシー設定が表示されます。タグはサーバーレス使用ポリシーから継承され、ワークスペース管理者のみが編集できます。

注

サーバーレス使用ポリシーが割り当てられた後、既存のパイプラインにポリシーのタグが自動的に付けされることはありません。ポリシーをアタッチする場合は、既存のパイプラインを手動で更新する必要があります。

サーバーレス使用ポリシーの詳細については、「サーバーレス使用ポリシーでの属性の使用」を参照してください。

パフォーマンスモードを選択する

トリガーされたパイプラインの場合は、パイプラインスケジューラのパフォーマンス 最適化 設定を使用して、サーバーレスコンピューティングパフォーマンスモードを選択できます。この設定を無効にすると、パイプラインは標準パフォーマンスモードを使用します。 Standard パフォーマンスモードは、起動待ち時間が少し長くなるワークロードのコストを削減するように設計されています。標準パフォーマンスモードを使用するサーバーレスワークロードは、通常、コンピューティングの可用性と最適化されたスケジュールに応じて、トリガーされてから 4 ~ 6 分以内に開始されます。

パフォーマンス最適化が有効になっている場合、パイプラインはパフォーマンス用に最適化されるため、時間の影響を受けやすいワークロードの起動と実行が高速化されます。

どちらのモードも同じ SKU を使用しますが、Standard パフォーマンスモードでは使用する DBU が少なく、コンピューティング使用量が少なくなります。

注

継続的パイプラインで標準パフォーマンスモードを使用するには、Databricks アカウントチームにお問い合わせください。

サーバーレスパイプラインの機能

サーバーレスパイプラインには、構成の簡略化に加えて、次の機能があります。

マテリアライズドビューのインクリメンタルリフレッシュ: 可能な限り、具体化ビューの更新はインクリメンタルに実行されます。増分更新の結果は、完全な再計算の結果と同じになります。結果を増分的に計算できない場合、更新では完全更新が使用されます。「具体化されたビューの増分更新」をご覧ください。

ストリームパイプライン処理: データインジェストなどのストリーミングデータワークロードの使用率、スループット、待機時間を向上させるために、マイクロバッチが "パイプライン化" されます。言い換えると、サーバーレスの Lakeflow Spark 宣言パイプラインは、標準の Spark Structured Streaming のようにマイクロバッチを順番に実行する代わりに、マイクロバッチを同時に実行し、コンピューティングリソースの使用率を向上させます。サーバーレスパイプラインでは、ストリームパイプラインは既定で有効になっています。
垂直自動スケーリング: サーバーレス Lakeflow Spark 宣言型パイプラインは、Databricks によって提供される水平自動スケーリングに追加されます。これは、メモリ不足エラーのために失敗することなくパイプラインを実行できる最もコスト効率の高いインスタンスの種類を自動的に割り当てることによって、自動スケールを強化しました。「垂直自動スケールとは?」を参照してください。

サーバーレスを使用するように既存のパイプラインを変換する

Unity カタログで構成された既存のパイプラインをサーバーレスパイプラインに変換できます。次の手順を実行します :

Azure Databricksワークスペースのサイドバーで、ジョブ & パイプラインをクリックします。
パイプラインの名前をクリックします。
[設定]をクリックします。
右側のサイドバーの [ コンピューティング] で、[ ] をクリックします。
Serverless の横にあるチェックボックスをオンにします。
[保存] をクリックします。

Important

サーバーレスを有効にすると、パイプライン用に構成したすべてのコンピューティング設定が削除されます。パイプラインをサーバーレス以外の更新プログラムに戻す場合は、必要なコンピューティング設定をパイプライン構成に再構成する必要があります。

サーバーレスパイプラインの DBU の使用状況を確認するにはどうすればよいでしょうか。

サーバーレス Lakeflow Spark 宣言型パイプラインの DBU 使用量は、Azure Databricks システムテーブルの一部である課金対象の使用状況テーブルに対してクエリを実行することで確認できます。サーバーレスパイプラインの DBU 使用量を参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-15

サーバーレス パイプラインを構成する

Requirements

サーバーレス パイプラインの推奨される構成

その他の構成に関する考慮事項

サーバーレス使用ポリシー

パフォーマンス モードを選択する

サーバーレス パイプラインの機能

サーバーレスを使用するように既存のパイプラインを変換する

サーバーレス パイプラインの DBU の使用状況を確認するにはどうすればよいでしょうか。

フィードバック

その他のリソース

サーバーレスパイプラインを構成する

サーバーレスパイプラインの推奨される構成

パフォーマンスモードを選択する

サーバーレスパイプラインの機能

サーバーレスパイプラインの DBU の使用状況を確認するにはどうすればよいでしょうか。