Freigeben über


Was sind Datenflüsse?

Tipp

Testen Sie Dataflow Gen2 in Data Factory in Microsoft Fabric, einer All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alles ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie ein neues Testangebot starten können – kostenlos!

Dataflows sind eine cloudbasierte Self-Service-Technologie zur Datenaufbereitung. Mit Datenflüssen können Kunden Daten in Microsoft Dataverse-Umgebungen, Power BI-Arbeitsbereiche oder das Azure Data Lake Storage-Konto Ihrer Organisation aufnehmen, transformieren und laden. Datenflüsse werden mithilfe von Power Query erstellt, einer einheitlichen Datenkonnektivität und Vorbereitung, die bereits in vielen Microsoft Produkten enthalten ist, einschließlich Excel und Power BI. Kunden können Datenflüsse auslösen, die entweder bei Bedarf oder automatisch nach einem Zeitplan ausgeführt werden; Daten werden immer auf dem neuesten Stand gehalten.

Datenflüsse können in mehreren Microsoft Produkten erstellt werden.

Datenflüsse werden in mehreren Microsoft Produkten vorgestellt und erfordern keine datenflowspezifische Lizenz, die erstellt oder ausgeführt werden muss. Datenflüsse sind in Power Apps, Power BI und Dynamics 365 Customer Insights verfügbar. Die Möglichkeit zum Erstellen und Ausführen von Datenflüssen ist mit den Lizenzen dieser Produkte gebündelt. Dataflow-Features sind größtenteils bei allen Produkten gemeinsam, in denen sie enthalten sind, aber im Vergleich könnte es produktspezifische Merkmale in Datenflüssen geben, die in einem Produkt erstellt wurden.

Wie funktioniert der Datenfluss?

Diagramm der Funktionsweise von Datenflüssen, von den Quelldaten bis zum Transformationsprozess und dann zum Speichern.

Die vorherige Abbildung zeigt eine Gesamtansicht der Definition eines Datenflusses. Ein Datenfluss ruft Daten aus verschiedenen Datenquellen ab (mehr als 80 Datenquellen werden bereits unterstützt). Basierend auf den Transformationen, die mit der Power Query Authoring-Erfahrung konfiguriert sind, transformiert der Datenfluss die Daten mithilfe der Datenfluss-Engine. Schließlich werden die Daten an das Ausgabeziel geladen, bei dem es sich um eine Microsoft Power Platform Umgebung, einen Power BI Arbeitsbereich oder das Azure Data Lake Storage Konto der Organisation handeln kann.

Datenflüsse werden in der Cloud ausgeführt

Datenflüsse sind cloudbasiert. Wenn ein Datenfluss erstellt und gespeichert wird, wird seine Definition in der Cloud gespeichert. Ein Datenfluss wird auch in der Cloud ausgeführt. Wenn eine Datenquelle jedoch lokal ist, kann ein lokales Datengateway verwendet werden, um die Daten in die Cloud zu extrahieren. Wenn eine Datenflussausführung ausgelöst wird, erfolgt die Datentransformation und -berechnung in der Cloud, und das Ziel befindet sich immer in der Cloud.

Diagramm der Ausführung von Datenflüssen in der Cloud, von der Datenquelle bis zum datenfluss, der in der Cloud ausgeführt wird, und anschließend zum Speichern.

Dataflows verwenden ein leistungsfähiges Transformationsmodul

Power Query ist das Datentransformationsmodul, das im Datenfluss verwendet wird. Dieser Motor ist fähig genug, viele fortgeschrittene Transformationen zu unterstützen. Außerdem wird eine einfache, aber dennoch leistungsstarke grafische Benutzeroberfläche verwendet, die Power Query Editor genannt wird. Mit diesem Editor können Sie Datenflüsse verwenden, um Ihre Datenintegrationslösungen schneller und einfacher zu entwickeln.

Screenshot mit einem Beispiel für Power Query transformations.

Datenflussintegration mit Microsoft Power Platform und Dynamics 365

Da ein Datenfluss die resultierenden Tabellen im cloudbasierten Speicher speichert, können andere Dienste mit den daten interagieren, die von Datenflüssen erzeugt werden.

Diagramm der Integration eines Datenflusses in Microsoft Power Platform und Dynamics 365.

Beispielsweise können Power BI, Power Apps, Power Automate, Power Virtual Agents und Dynamics 365 Anwendungen die vom Datenfluss erzeugten Daten abrufen, indem sie eine Verbindung mit Dataverse, einem Power Platform-Datenflussconnector oder direkt über den See herstellen, abhängig von dem Ziel, das zur Erstellungszeit des Datenflusses konfiguriert wurde.

Vorteile von Datenflüssen

In der folgenden Liste werden einige der Vorteile der Verwendung von Datenflüssen hervorgehoben:

  • Ein Datenfluss entkoppelt die Datentransformationsebene von der Modellierungs- und Visualisierungsebene in einer Power BI Lösung.

  • Der Datentransformationscode kann sich an einem zentralen Ort, einem Datenfluss befinden und nicht zwischen mehreren Artefakten verteilt werden.

  • Ein Datenflussersteller benötigt nur Power Query Fähigkeiten. In einer Umgebung mit mehreren Erstellern kann der Dataflow-Ersteller Teil eines Teams sein, das zusammen die gesamte BI-Lösung oder betriebsbereite Anwendung erstellt.

  • Ein Datenfluss ist produktunabhängig. Es ist keine Komponente von Power BI; Sie können seine Daten in anderen Tools und Diensten abrufen.

  • Dataflows profitieren von Power Query, einem leistungsstarken, grafischen, Selbstbedienungs-Datentransformationserlebnis.

  • Datenflüsse werden vollständig in der Cloud ausgeführt. Es ist keine zusätzliche Infrastruktur erforderlich.

  • Sie haben mehrere Möglichkeiten, mit Datenflüssen zu arbeiten, indem Sie Lizenzen für Power Apps, Power BI und Customer Insights verwenden.

  • Obwohl Datenflüsse in der Lage sind, erweiterte Transformationen auszuführen, sind sie für Self-Service-Szenarien konzipiert und erfordern keinen IT- oder Entwicklerhintergrund.

Anwendungsfälle für Datenflüsse

Sie können Datenflüsse für viele Zwecke verwenden. Die folgenden Szenarien enthalten einige Beispiele für häufige Anwendungsfälle für Datenflüsse.

Datenmigration von älteren Systemen

In diesem Szenario entscheidet sich eine Organisation, Power Apps für die neue Benutzeroberfläche anstelle des älteren lokalen Systems zu verwenden. Power Apps, Power Automate und AI Builder verwenden alle Dataverse als primäres Datenspeichersystem. Die aktuellen Daten im vorhandenen lokalen System können mithilfe eines Datenflusses in Dataverse migriert werden, und dann können diese Produkte diese Daten verwenden.

Verwenden von Datenflüssen zum Erstellen eines Data Warehouses

Sie können Dataflows als Ersatz für andere Extrakt-, Transformations-, Lade- (ETL)-Tools verwenden, um ein Data Warehouse zu erstellen. In diesem Szenario entscheiden sich die Dateningenieure eines Unternehmens, Datenflüsse zu verwenden, um das Star-Schema-gestaltete Data Warehouse zu erstellen, einschließlich Fakten- und Dimensionstabellen in Data Lake Storage. Anschließend wird Power BI verwendet, um Berichte und Dashboards zu generieren, indem Daten aus den Datenflüssen abgerufen werden.

Diagramm zum Erstellen eines Data Warehouses mithilfe von Datenflüssen.

Verwenden von Datenflüssen zum Erstellen eines dimensionalen Modells

Sie können Datenflüsse als Ersatz für andere ETL-Tools verwenden, um ein dimensionales Modell zu erstellen. Beispielsweise entscheiden sich die Dateningenieure eines Unternehmens für die Verwendung von Datenflüssen, um das im Sternschema entworfene dimensionale Modell zu erstellen, einschließlich Fakten- und Dimensionstabellen in Azure Data Lake Storage Gen2. Anschließend wird Power BI verwendet, um Berichte und Dashboards zu generieren, indem Daten aus den Datenflüssen abgerufen werden.

Diagramm zum Erstellen eines dimensionalen Modells mithilfe von Datenflüssen.

Zentrale Datenvorbereitung und Wiederverwendung von semantischen Modellen in mehreren Power BI Lösungen

Wenn mehrere Power BI Lösungen dieselbe transformierte Version einer Tabelle verwenden, wird der Prozess zum Erstellen der Tabelle mehrmals wiederholt. Dies erhöht die Auslastung des Quellsystems, verbraucht mehr Ressourcen und erstellt doppelte Daten mit mehreren Fehlerpunkten. Stattdessen kann ein einzelner Datenfluss erstellt werden, um die Daten für alle Lösungen zu berechnen. Power BI können dann das Ergebnis der Transformation in allen Lösungen wiederverwenden. Der Datenfluss kann, wenn er auf eine solche Weise verwendet wird, Teil einer robusten Power BI Implementierungsarchitektur sein, die die Power Query Codeduplikate vermeidet und die Wartungskosten der Datenintegrationsebene reduziert.

Diagramm, wie Tabellen in mehreren Lösungen wiederverwendet werden können.