適用対象:
Azure Data Factory
Azure Synapse Analytics
ヒント
Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。 データ統合を初めて使用する場合は、Fabric Data Factory から始めます。 既存の ADF ワークロードをFabricにアップグレードして、データ サイエンス、リアルタイム分析、レポートの新機能にアクセスできます。
データ フローは、Azure Data Factory パイプラインとAzure Synapse Analytics パイプラインの両方で使用できます。 この記事は、マッピング データ フローに適用されます。 変換を初めて使用する場合は、入門記事「 マッピング データ フローを使用したデータの変換」を参照してください。
ヒント
Dataflow Gen2 の同等の変換 (追加クエリ) については、データ フロー ユーザーのマッピングに関する Dataflow Gen2 のガイドを参照してください。
Unionは複数のデータストリームを1つに結合し、Union変換からの新しい出力としてそれらのストリームのSQL Unionを生成します。 各入力ストリームのすべてのスキーマは、結合キーを必要とすることなく、データ フロー内で結合されます。
設定テーブル内の n 個のストリームを結合するには、構成された各行の横にある [+] アイコンを選択します。これには、ソース データと、データ フロー内の既存の変換からのストリームの両方が含まれます。
マッピング データ フローでの和集合変換を短いビデオで分かりやすく紹介いたします。
ここでは、複数のソース (この例では、3 つの異なるソース ファイル) の異種のメタデータを結合して、1 つのストリームにまとめることができます。
これを実現するには、追加したいすべてのソースを含めて、ユニオン設定に行を追加します。 一般的な参照キーや結合キーは必要ありません。
ユニオンの後に Select 変換を設定すると、重複しているフィールドまたはヘッダーなしのソースから名前が付いていないフィールドの名前を変更することができます。 [検査] を選択すると、この例の合計列数が 132 個のメタデータが 3 つの異なるソースから表示されます。
名前と位置
"名前による結合" を選択すると、各列の値は、新しく連結されたメタデータスキーマを使用して、各ソースの対応する列に配置されます。
"位置による和集合" を選択すると、各列の値が対応する各ソースの元の位置にドロップされ、新しい結合されたデータ ストリームが生成され、各ソースのデータが同じストリームに追加されます。