データフローとは

ヒント

Power BI Dataflow Gen1 は従来の状態になり、新機能への投資を受け取ることはありません。 Fabric アクセス権を持つ Premium のお客様には、 Dataflow Gen2 が推奨されるパスであり、パフォーマンス、スケール、信頼性、機能、および組み込みの AI の改善が提供されます。 Pro/PPU のお客様は、これらのシナリオの Gen2 ガイダンスが進化するため、引き続き Gen1 を使用できます。 アップグレードのガイダンスについては、「 Dataflow Gen1 から Dataflow Gen2 への アップグレード」を参照してください。

データフローは、セルフサービスによるクラウドベースのデータ準備テクノロジです。 データフローを使用すると、お客様は、Microsoft Dataverse環境、Power BIワークスペース、または組織のAzure Data Lake Storage アカウントにデータを取り込み、変換し、読み込むことができます。 データフローは、ExcelやPower BIなど、多くのMicrosoft製品で既に取り上げられる統合されたデータ接続と準備エクスペリエンスであるPower Queryを使用して作成されます。 お客様は、必要に応じて、またはスケジュールに従って自動的に実行するデータフローをトリガーできます。データは常に最新の状態に保たれます。

データフローは複数のMicrosoft製品で作成できます

データフローは複数のMicrosoft製品で取り上げられ、データフロー固有のライセンスを作成または実行する必要はありません。 データフローは、Power Apps、Power BI、Dynamics 365 Customer Insights で使用できます。 データフローを作成して実行する機能は、それらの製品のライセンスにバンドルされています。 データフロー機能は、取り上げられるすべての製品で最も一般的ですが、製品固有の一部の機能は、ある製品と別の製品で作成されたデータフローに存在する可能性があります。

データフローはどのように機能しますか?

ソース データから変換プロセス、ストレージまで、データフローがどのように機能するかを示す図。

前の図は、データフローの定義方法の全体像を示しています。 データフローは、さまざまなデータ ソースからデータを取得します (80 を超えるデータ ソースが既にサポートされています)。 次に、Power Query作成エクスペリエンスで構成された変換に基づいて、データフロー はデータフロー エンジンを使用してデータを変換します。 最後に、データは出力先に読み込まれます。出力先には、Microsoft Power Platform環境、Power BI ワークスペース、または組織のAzure Data Lake Storage アカウントを指定できます。

クラウドで実行されるデータフロー

データフローはクラウドベースです。 データフローを作成して保存すると、その定義はクラウドに格納されます。 データフローはクラウドでも実行されます。 ただし、データ ソースがオンプレミスの場合は、オンプレミス データ ゲートウェイを使用してクラウドにデータを抽出できます。 データフローの実行がトリガーされると、データ変換と計算はクラウドで行われ、変換先は常にクラウド内にあります。

データ ソースからクラウドで実行されるデータフロー、クラウドで実行されているデータフロー、ストレージに対するデータフローの実行方法を示す図。

データフローで強力な変換エンジンを使用する

Power Queryは、データフローで使用されるデータ変換エンジンです。 このエンジンは、多くの高度な変換をサポートするのに十分な能力を備えています。 また、Power Query エディターと呼ばれる単純で強力なグラフィカル ユーザー インターフェイスも使用します。 このエディターでデータフローを使用すると、データ統合ソリューションをより迅速かつ簡単に開発できます。

Power Query の変換例を示すスクリーンショット。

Microsoft Power PlatformおよびDynamics 365とのデータフロー統合

データフローは結果のテーブルをクラウドベースのストレージに格納するため、他のサービスはデータフローによって生成されたデータと対話できます。

Microsoft Power PlatformおよびDynamics 365とデータフローがどのように統合されるかを示す図。

たとえば、Power BI、Power Apps、Power Automate、Power Virtual Agents、Dynamics 365 アプリケーションは、データフローの作成時に構成された宛先に応じて、Dataverse、Power Platform データフロー コネクタ、またはレイク経由で直接接続することで、データフローによって生成されるデータを取得できます。

データフローの利点

次の一覧では、データフローを使用する利点の一部を示します。

  • データフローは、データ変換レイヤーを、Power BI ソリューションのモデリングレイヤーと視覚化レイヤーから切り離します。

  • データ変換コードは、複数の成果物に分散するのではなく、中央の場所 (データフロー) に配置できます。

  • データフロー作成者は、Power Queryスキルのみを必要とします。 複数の作成者が存在する環境では、データフロー作成者は、BI ソリューション全体または運用アプリケーション全体を構築するチームの一員にすることができます。

  • データフローは製品に依存しません。 Power BIのみのコンポーネントではありません。他のツールやサービスでデータを取得できます。

  • データフローでは、強力なグラフィカルなセルフサービスデータ変換エクスペリエンスであるPower Queryを利用します。

  • データフローは完全にクラウドで実行されます。 追加のインフラストラクチャは必要ありません。

  • Power Apps、Power BI、Customer Insights のライセンスを使用して、データフローの操作を開始するための複数のオプションがあります。

  • データフローは高度な変換が可能ですが、セルフサービス シナリオ向けに設計されており、IT や開発者のバックグラウンドは必要ありません。

データフローのユース ケース シナリオ

データフローはさまざまな目的で使用できます。 次のシナリオでは、データフローの一般的なユース ケースの例をいくつか示します。

レガシ システムからのデータ移行

このシナリオでは、組織は、従来のオンプレミス システムではなく、新しいユーザー インターフェイス エクスペリエンスにPower Appsを使用することを決定します。 Power Apps、Power Automate、AI Builderはすべて、プライマリ データ ストレージ システムとして Dataverse を使用します。 既存のオンプレミス システムの現在のデータは、データフローを使用して Dataverse に移行でき、これらの製品はそのデータを使用できます。

データフローを使用してデータ ウェアハウスを構築する

他の抽出、変換、読み込み (ETL) ツールの代わりにデータフローを使用して、データ ウェアハウスを構築できます。 このシナリオでは、企業のデータ エンジニアは、データフローを使用して、Data Lake Storageのファクト テーブルやディメンション テーブルなど、スター スキーマで設計されたデータ ウェアハウスを構築することにしました。 その後、Power BIを使用して、データフローからデータを取得してレポートとダッシュボードを生成します。

データフローを使用してデータ ウェアハウスを構築する方法の図。

データフローを使用してディメンション モデルを構築する

他の ETL ツールの代わりにデータフローを使用して、ディメンション モデルを構築できます。 たとえば、企業のデータ エンジニアは、データフローを使用して、Azure Data Lake Storage Gen2のファクト テーブルやディメンション テーブルなど、スター スキーマ設計のディメンション モデルを構築することにしました。 その後、Power BIを使用して、データフローからデータを取得してレポートとダッシュボードを生成します。

データフローを使用してディメンション モデルを構築する方法の図。

複数のPower BI ソリューション間でセマンティック モデルのデータ準備と再利用を一元化する

複数のPower BI ソリューションが同じ変換されたバージョンのテーブルを使用している場合、テーブルを作成するプロセスが複数回繰り返されます。 これにより、ソース システムの負荷が増加し、より多くのリソースが消費され、複数の障害点で重複するデータが作成されます。 代わりに、1 つのデータフローを作成して、すべてのソリューションのデータを計算できます。 その後、Power BI変換の結果をすべてのソリューションで再利用できます。 このような方法で使用する場合、データフローは、Power Query コードの重複を回避し、データ統合レイヤーのメンテナンス コストを削減する堅牢なPower BI実装アーキテクチャの一部にすることができます。

複数のソリューション間でテーブルを再利用する方法の図。

  • Microsoft Power Platform
  • Power BI