Del via


Hvad er dataflow?

Tips

Prøv Dataflow Gen2 i Data Factory i Microsoft Fabric, en alt-i-en analyseløsning til virksomheder. Microsoft Fabric dækker alt fra dataflytning til data science, realtidsanalyse, business intelligence og rapportering. Lær at starte en ny prøveperiode gratis!

Dataflow er en selvbetjent, cloudbaseret teknologi til dataforberedelse. Dataflows gør det muligt for kunder at indlæse, transformere og indlæse data i Microsoft Dataverse-miljøer, Power BI-arbejdsområder eller din organisations Azure Data Lake Storage-konto. Dataflows oprettes ved hjælp af Power Query, en samlet dataforbindelses- og forberedelsesoplevelse, som allerede findes i mange Microsoft-produkter, herunder Excel og Power BI. Kunder kan aktivere dataflows til at køre enten on demand eller automatisk efter en tidsplan; Data holdes altid opdateret.

Dataflows kan oprettes i flere Microsoft-produkter

Dataflows findes i flere Microsoft-produkter og kræver ikke en dataflow-specifik licens for at blive oprettet eller kørt. Dataflows er tilgængelige i Power Apps, Power BI og Dynamics 365 Customer Insights. Muligheden for at oprette og køre dataflows følger med disse produkters licenser. Dataflow-funktioner er for det meste almindelige på tværs af alle produkter, de vises i, men nogle produktspecifikke funktioner kan eksistere i dataflows, der er skabt i ét produkt frem for et andet.

Hvordan fungerer dataflowet?

Diagram over, hvordan dataflows fungerer, fra kildedataene til transformationsprocessen og derefter til lagring.

Det forrige billede viser et overordnet billede af, hvordan et dataflow defineres. Et dataflow henter data fra forskellige datakilder (mere end 80 datakilder understøttes allerede). Derefter, baseret på transformationerne konfigureret med Power Query-forfatteroplevelsen, transformerer dataflowet dataene ved at bruge dataflow-motoren. Endelig indlæses dataene til outputdestinationen, som kan være et Microsoft Power Platform-miljø, et Power BI-arbejdsområde eller organisationens Azure Data Lake Storage-konto.

Dataflows kører i skyen

Dataflows er cloud-baserede. Når et dataflow oprettes og gemmes, gemmes dets definition i skyen. Et dataflow kører også i skyen. Hvis en datakilde dog er on-premises, kan en on-premises datagateway bruges til at udtrække dataene til skyen. Når et dataflow-kørsel udløses, sker datatransformationen og beregningen i skyen, og destinationen er altid i skyen.

Diagram over, hvordan dataflows kører i skyen, fra datakilden til dataflowet, der kører i skyen, og derefter til lagring.

Dataflows bruger en kraftfuld transformationsmotor

Power Query er datatransformationsmotoren, der bruges i dataflowet. Denne motor er kapabel nok til at understøtte mange avancerede transformationer. Den bruger også en ligetil, men kraftfuld, grafisk brugergrænseflade kaldet Power Query editor. Du kan bruge dataflows med denne editor til at udvikle dine dataintegrationsløsninger hurtigere og nemmere.

Skærmbillede, der viser et eksempel på Power Query transformationer.

Dataflow-integration med Microsoft Power Platform og Dynamics 365

Fordi et dataflow gemmer de resulterende tabeller i cloud-baseret lagring, kan andre tjenester interagere med de data, der produceres af dataflowene.

diagram over, hvordan et dataflow integreres med Microsoft Power Platform og Dynamics 365.

For eksempel kan Power BI, Power Apps, Power Automate, Power Virtual Agents og Dynamics 365-applikationer hente de data, der produceres af dataflowet, ved at forbinde til Dataverse, en Power Platform dataflow-connector, eller direkte gennem søen, afhængigt af destinationen konfigureret ved dataflow-oprettelse.

Fordele ved dataflows

Følgende liste fremhæver nogle af fordelene ved at bruge dataflows:

  • Et dataflow adskiller datatransformationslaget fra modellerings- og visualiseringslaget i en Power BI-løsning.

  • Datatransformationskoden kan befinde sig centralt, i et dataflow, i stedet for at være spredt ud over flere artefakter.

  • En dataflow-skaber behøver kun Power Query-færdigheder. I et miljø med flere skabere kan dataflow-skaberen være en del af et team, der sammen bygger hele BI-løsningen eller den operationelle applikation.

  • Et dataflow er produkt-agnostisk. Det er ikke kun en komponent i Power BI; du kan få data i andre værktøjer og tjenester.

  • Dataflows udnytter Power Query, en kraftfuld, grafisk, selvbetjent datatransformationsoplevelse.

  • Dataflows kører udelukkende i skyen. Der kræves ingen ekstra infrastruktur.

  • Du har flere muligheder for at begynde at arbejde med dataflows, ved at bruge licenser til Power Apps, Power BI og Customer Insights.

  • Selvom dataflows kan lave avancerede transformationer, er de designet til selvbetjeningsscenarier og kræver ingen IT- eller udviklerbaggrund.

Brugsscenarier for dataflows

Du kan bruge dataflows til mange formål. Følgende scenarier giver nogle eksempler på almindelige anvendelsestilfælde for dataflows.

Datamigrering fra ældre systemer

I dette scenarie beslutter en organisation at bruge Power Apps til den nye brugergrænseflade i stedet for det gamle on-premises system. Power Apps, Power Automate og AI Builder bruger alle Dataverse som det primære datalagringssystem. De nuværende data i det eksisterende on-premises system kan migreres til Dataverse ved hjælp af et dataflow, og disse produkter kan derefter bruge disse data.

Brug af dataflows til at opbygge et datawarehouse

Du kan bruge dataflows som erstatning for andre extract, transform, load (ETL) værktøjer til at bygge et datawarehouse. I dette scenarie beslutter dataingeniørerne i en virksomhed at bruge dataflows til at opbygge deres star schema-designede datalager, inklusive fakta- og dimensionstabeller i Data Lake Storage. Derefter bruges Power BI til at generere rapporter og dashboards ved at hente data fra dataflowene.

Diagram over, hvordan man bygger et datawarehouse ved hjælp af dataflows.

Brug af dataflows til at opbygge en dimensionel model

Du kan bruge dataflows som erstatning for andre ETL-værktøjer til at bygge en dimensionel model. For eksempel beslutter dataingeniørerne i en virksomhed at bruge dataflows til at bygge den stjerneskema-designede dimensionelle model, inklusive fakta- og dimensionstabeller i Azure Data Lake Storage Gen2. Derefter bruges Power BI til at generere rapporter og dashboards ved at hente data fra dataflowene.

Diagram over, hvordan man bygger en dimensionel model ved hjælp af dataflows.

Centraliser dataforberedelse og genbrug af semantiske modeller på tværs af flere Power BI-løsninger

Hvis flere Power BI-løsninger bruger den samme transformerede version af en tabel, gentages processen med at oprette tabellen flere gange. Dette øger belastningen på kildesystemet, forbruger flere ressourcer og skaber duplikerede data med flere fejlpunkter. I stedet kan der oprettes et enkelt dataflow til at beregne dataene for alle løsninger. Power BI kan derefter genbruge resultatet af transformationen i alle løsninger. Dataflowet, hvis det bruges på denne måde, kan være en del af en robust Power BI-implementeringsarkitektur, der undgår Power Query-kodens duplikationer og reducerer vedligeholdelsesomkostningerne for dataintegrationslaget.

Diagram over, hvordan tabeller kan genbruges på tværs af flere løsninger.