Del via


Begreber til Fabric-dataagenter

Data agent i Microsoft Fabric er en ny Microsoft Fabric-funktion, der gør det muligt at bygge din egen samtalebaserede Q& Et system ved at bruge generativ AI. En Fabric-dataagent gør dataindsigt mere tilgængelig og handlingsvenlig for alle i din organisation. Ved at bruge en Fabric-dataagent kan dit team have samtaler med spørgsmål på almindeligt engelsk om de data, som din organisation har gemt i Fabric OneLake og derefter modtage relevante svar. På denne måde kan selv personer uden teknisk ekspertise inden for kunstig intelligens eller en dyb forståelse af datastrukturen modtage præcise og kontekstrige svar. Inden for bredere agentiske applikationsarkitekturer på Microsoft Fabric fungerer dataagenter som den samtalebaserede analysekomponent, der forbinder til styrede data i OneLake gennem lakehouses, warehouses, semantiske modeller og KQL-databaser i multi-agent-løsninger.

Du kan også tilføje organisationsspecifikke instruktioner, eksempler og vejledning for at finjustere Fabric-dataagenten. Denne tilgang sikrer, at svarene stemmer overens med din organisations behov og mål, så alle kan engagere sig mere effektivt i data. Fabric data agent fremmer en kultur af datadrevet beslutningstagning, fordi det sænker barrierer for indsigtsadgang, fremmer samarbejde og hjælper din organisation med at udtrække mere værdi fra sine data.

Prerequisites

Ledelsesforudsætninger

Hvis din lejer eller arbejdsplads er underlagt Microsoft Purview-politikker, skal agenter operere inden for disse politikker. Følgende Purview-politikker kan begrænse agentens adgang og de resultater, agenterne returnerer, baseret på følsomhed og policykonfiguration:

  • Purview DLP-politikker i Fabric Data Warehouse (generelt tilgængelig): DLP-politikker kan opdage og begrænse adgangen til følsomme data i warehouse-aktiver, som agenten forespørger.
  • Adgangsrestriktioner (forhåndsvisning) for Fabric KQL Database, Fabric SQL Database og Fabric Data Warehouse: Disse politikker kan forhindre agenten i at tilgå eller returnere resultater fra assets, der er klassificeret som følsomme.

Sådan fungerer Fabric-dataagenten

Fabric-dataagenten bruger store sprogmodeller (LLM'er) til at hjælpe brugere med at interagere naturligt med deres data. Fabric-dataagenten anvender Azure OpenAI Assistant API'er og opfører sig som en agent. Den behandler brugerspørgsmål, bestemmer den mest relevante datakilde (Lakehouse, Warehouse, Power BI-datasæt, KQL-databaser, ontologi eller Microsoft Graph) og aktiverer det relevante værktøj til at generere, validere og udføre forespørgsler. Brugerne kan derefter stille spørgsmål i klart sprog og modtage strukturerede, menneskeligt læsbare svar. Denne tilgang eliminerer behovet for at skrive komplekse forespørgsler og sikrer nøjagtig og sikker dataadgang.

Sådan fungerer det i detaljer:

Spørgsmålsanalyse og validering: Fabric-dataagenten anvender Azure OpenAI Assistant API'er som den underliggende agent til at behandle brugerspørgsmål. Denne fremgangsmåde sikrer, at spørgsmålet er i overensstemmelse med sikkerhedsprotokoller, ansvarlige AI-politikker (RAI) og brugertilladelser. Fabric-dataagenten respekterer også Microsoft Purviews styringskontroller, der anvendes på de underliggende Fabric-datakilder, herunder Data Loss Prevention (DLP) og adgangsrestriktioner. Politikhåndhævelse kan forhindre, at visse forespørgsler kører, eller at specifikke data dukker op i svar. Fabric-dataagenten gennemtvinger kun skrivebeskyttet adgang og vedligeholder skrivebeskyttede dataforbindelser til alle datakilder.

Håndhævelsesmekanismer: Fabric-dataagenten anvender flere lag beskyttelse under behandlingen. Den bruger den anmoderende brugers legitimationsoplysninger og tilladelser til at håndhæve adgang med mindst privilegier, hvilket sikrer, at hver interaktion kun når data, som brugeren har tilladelse til at se. Agenten vurderer anmodninger ud fra lejer- og arbejdsområdepolitikindstillinger, før nogen handling udføres. Sikkerhedsrammer begrænser værktøjets kald og output til scoped datakilder, hvilket forhindrer forespørgsler i at nå ressourcer uden for det konfigurerede scope. Du kan valgfrit integrere Azure AI Content Safety for at anvende risikokontroller for indhold, der hjælper med at reducere skadelige eller utraditionelle svar.

Datakildeidentifikation: Fabric-dataagenten bruger brugerens legitimationsoplysninger til at få adgang til datakildens skema. Denne tilgang sikrer, at systemet henter datastrukturinformation, som brugeren har tilladelse til at se. Agenten vurderer derefter brugerens spørgsmål mod alle tilgængelige datakilder, herunder relationelle databaser (Lakehouse og Warehouse), Power BI-datasæt (Semantic Models), KQL-databaser, ontologier og Microsoft Graph. Den kan også referere til brugeranvisninger til dataagenter for at bestemme den mest relevante datakilde. For Power BI semantiske modeller bruger agenten brugerens læsetilladelse på modellen til at hente skema og metadata til generering af forespørgsler; Byggetilladelse er ikke nødvendig for agentdrevne forespørgsler.

Værktøjskald og generering af forespørgsler: Når den korrekte datakilde eller kilder er identificeret, omformulerer Fabric-dataagenten spørgsmålet for klarhed og struktur og aktiverer derefter det tilsvarende værktøj for at generere en struktureret forespørgsel:

  • Naturligt sprog til SQL (NL2SQL) for relationsdatabaser (Lakehouse/Warehouse).
  • Naturligt sprog til DAX (NL2DAX) for Power BI-datasæt (Semantiske Modeller).
  • Naturligt sprog til KQL (NL2KQL) for KQL-databaser. NL2KQL kan bruge KQL brugerdefinerede funktioner (UDF'er), når de er tilgængelige i de valgte databaser.
  • Microsoft Graph forespørger efter organisationsdata, der er tilgængelige via Microsoft Graph.

Det valgte værktøj genererer en forespørgsel baseret på det angivne skema, de angivne metadata og den kontekst, som agenten bag Fabric-dataagenten derefter overfører.

Forespørgselsvalidering: Værktøjet udfører validering for at sikre, at forespørgslen er korrekt oprettet og overholder sine egne sikkerhedsprotokoller og RAI-politikker.

Forespørgselsudførelse og svar: Når det er valideret, udfører Fabric-dataagenten forespørgslen mod den valgte datakilde. Resultaterne er formateret til et svar, der kan læses af mennesker, og som kan omfatte strukturerede data, f.eks. tabeller, opsummeringer eller nøgleindsigt.

Ved at bruge denne tilgang kan brugere interagere med deres data ved hjælp af naturligt sprog. Fabric-dataagenten håndterer kompleksiteten ved generering, validering og udførelse af forespørgsler. Brugere behøver ikke selv at skrive SQL, DAX eller KQL.

Sikkerhed og styring med Microsoft Purview

Microsoft Purview leverer styrings- og risikokontrol for Fabric-dataagenter. Disse funktioner er i øjeblikket i forhåndsvisning og hjælper organisationer med at opretholde overholdelse, når de bruger agenter til at få adgang til Fabric-data. Her er nogle af de vigtige funktioner:

  • Risikoopdagelse og revision: Prompts og svar fra Fabric-dataagenter kan være underlagt Purviews risikoopdagelse og revision, hvilket giver sikkerhedsteams indsigt i, hvordan agenter interagerer med organisatoriske data.
  • DSPM Data Risk Assessments: Data Security Posture Management (DSPM) Data Risk Assessments kan afdække følsomme datarisici i de datakilder, som agenter bruger, og hjælpe dig med at identificere og håndtere potentiel eksponering.
  • Insider risikostyring: Purview Insider Risk Management kan opdage risikable AI-brugsmønstre med agenter, såsom usædvanlige forespørgselsmængder eller adgang til følsomme data.
  • Revision, eDiscovery og retention: Purview Audit, eDiscovery og opbevaringspolitikker gælder for agentinteraktioner og output i understøttede Fabric-arbejdsbelastninger. Ikke-kompatibel brugsdetektion kan også markere agentaktivitet, der overtræder organisationens politikker.

For mere information om, hvordan Microsoft Purview integreres med Fabric, se Brug Microsoft Purview til at styre Microsoft Fabric.

Konfiguration af Fabric-dataagent

At konfigurere en Fabric-dataagent minder om at bygge en Power BI-rapport—du starter med at designe og forfine den, så den opfylder dine behov, og derefter publicerer og deler den med kolleger, så de kan interagere med dataene. Konfiguration af en Fabric-dataagent omfatter:

Udvælgelse af datakilder: En Fabric-dataagent understøtter op til fem datakilder i enhver kombination, herunder lakehouses, warehouses, KQL-databaser, Power BI-semantiske modeller, ontologier og Microsoft Graph. For eksempel kan en konfigureret Fabric-dataagent inkludere fem Power BI semantiske modeller. Det kunne inkludere en blanding af to Power BI-semantiske modeller, et lakehouse og en KQL-database. Du har mange tilgængelige indstillinger.

Valg af relevante tabeller: Når du har valgt datakilderne, tilføjer du dem én ad gangen og definerer de specifikke tabeller fra hver kilde, som Fabric-dataagenten bruger. Dette trin sikrer, at Fabric-dataagenten henter nøjagtige resultater ved kun at fokusere på relevante data. For lakehouses betyder dette trin, at man vælger lakehouse-tabeller (ikke individuelle lakehouse-filer). Hvis dine data starter som filer (for eksempel CSV eller JSON), gør dem tilgængelige for agenten ved at indlæse dem i tabeller eller på anden måde eksponere dem gennem tabeller.

Tilføjelse af kontekst: For at forbedre nøjagtigheden af Fabric-dataagenten, giv mere kontekst gennem instruktioner og eksempelforespørgsler. Som den underliggende agent for Fabric-dataagenten hjælper konteksten Azure OpenAI Assistant API'en med at træffe mere informerede beslutninger om, hvordan brugerspørgsmål skal behandles, og afgøre, hvilken datakilde der er bedst egnet til at besvare dem.

  • Instruktioner til dataagenten: Tilføj instruktioner til at vejlede agenten, der ligger til grund for Fabric-dataagenten, i at bestemme den bedste datakilde til at besvare specifikke typer spørgsmål. Du kan også angive brugerdefinerede regler eller definitioner, der tydeliggør organisationsterminologi eller specifikke krav. Disse instruktioner kan give mere kontekst eller indstillinger, der påvirker, hvordan agenten vælger og forespørger datakilder. For eksempel kan spørgsmål om finansielle målinger til en Power BI semantisk model tildeles forespørgsler, der involverer rå dataudforskning til søhuset, og sende spørgsmål, der kræver log-analyse til KQL-databasen.

  • Eksempelforespørgsler: Tilføj eksempler på spørgsmål-forespørgselspar for at illustrere, hvordan Fabric-dataagenten skal svare på almindelige forespørgsler. Disse eksempler fungerer som en vejledning til agenten, hvilket hjælper den med at forstå, hvordan lignende spørgsmål fortolkes og genererer nøjagtige svar.

Note

Tilføjelse af eksempel-forespørgsels-/spørgsmålspar understøttes ikke i øjeblikket for Power BI semantiske modeldatakilder.

Ved at kombinere tydelige AI-instruktioner og relevante eksempelforespørgsler kan du bedre tilpasse Fabric-dataagenten til din organisations databehov og sikre mere nøjagtige og kontekstafhængige svar.

Vigtigt!

Instruktioner og eksempelforespørgsler fra udvikleren skal operere inden for organisatoriske og rollebaserede rammer. Hvis instruktioner eller prompts er i konflikt med politikken (for eksempel forsøg på at omgå skrivebeskyttet adfærd eller få adgang til kilder uden for scope), nægter eller omdirigerer agenten anmodningen i henhold til den præcedensmodel, der er beskrevet i det følgende afsnit.

Styrings- og hensigtslag

Når du konfigurerer en Fabric-dataagent, kan flere lag af intention påvirke, hvordan agenten opfører sig. Disse lag, listet fra højeste til laveste prioritet, definerer, hvad agenten må gøre:

  1. Organisatorisk hensigt: Lejerdækkende politikker og compliance-krav fastsat af organisationens administratorer. Disse begrænsninger har højeste prioritet og kan ikke tilsidesættes af noget andet lag.
  2. Rollebaseret intention: Arbejdsområdestyringsindstillinger og tilladelsesgrænser, der gælder for specifikke roller eller grupper. Disse indstillinger håndhæver adgangskontroller og begrænsninger i datascope.
  3. Udviklerintention: Brugerdefinerede instruktioner, eksempelforespørgsler og datakildekonfigurationer, som du angiver, når du bygger dataagenten.
  4. Brugerintention: Spørgsmål og prompts, som slutbrugere indsender under samtaler med agenten.

Når der opstår konflikter mellem lag, tilsidesætter lag med højere prioritet de lavere. For eksempel tilsidesætter organisationspolitikker og arbejdsområdestyringsindstillinger altid udviklerinstruktioner og brugerprompts. Denne præcedensmodel sikrer, at agenten opererer inden for godkendte grænser, uanset hvordan den konfigureres eller bestilles.

Forskel mellem en Fabric-dataagent og en copilot

Selvom både Fabric-dataagenter og Fabric-copiloter bruger generativ AI til at behandle og ræsonnere over data, findes der væsentlige forskelle i deres funktionalitet og anvendelsestilfælde:

Konfigurationsfleksibilitet: Du kan konfigurere Fabric-dataagenter i høj grad. Du kan angive brugerdefinerede instruktioner og eksempler for at tilpasse deres funktionsmåde til bestemte scenarier. Fabric copilots kommer derimod forudkonfigureret og tilbyder ikke dette niveau af tilpasning.

Omfang og anvendelse: Fabric-copiloter hjælper med opgaver inden for Microsoft Fabric, såsom generering af notebook-kode eller lagerforespørgsler. Fabric data-agenter er derimod selvstændige konfigurerbare artefakter, der kan forespørge data på tværs af OneLake og semantiske modeller. Fabric-dataagenter kan også integreres med Microsoft 365 Copilot for at fremhæve indsigter i naturligt sprog direkte i Microsoft 365-apps. Når agenter tilgås via Microsoft 365 Copilot, gælder Microsoft Purviews styringspolitikker stadig for de underliggende datakilder. Derudover kan Fabric-dataagenter forbinde til eksterne systemer som Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams eller andre værktøjer uden for Fabric. Eksterne orkestratorer og multi-agent runtimes kan påkalde Fabric-dataagenter for at understøtte end-to-end agentiske workflows, mens dataagenterne forbliver fokuseret på skrivebeskyttet, styret dataadgang.

Evaluering af Fabric-dataagenten

Produktteamet evaluerede grundigt kvaliteten og sikkerheden af Fabric-dataagentens svar:

Benchmark-test: Produktteamet testede Fabric-dataagenter på tværs af en række offentlige og private datasæt for at sikre høj kvalitet og nøjagtige svar.

Forbedrede skademinimeringer: Produktteamet implementerede sikkerhedsforanstaltninger for at sikre, at outputtet fra Fabric-dataagenter forbliver fokuseret på konteksten af udvalgte datakilder, hvilket reducerer risikoen for irrelevante eller vildledende svar.

Styring og sikkerhed

Microsoft Purview-integration giver styringskontrol for Fabric-dataagenter. Når du konfigurerer en dataagent, gælder Purviews styringspolitikker for de underliggende datakilder, agenten kan tilgå. Denne integration hjælper med at sikre, at dataadgang via agenter følger de samme overholdelses- og klassifikationsregler som direkte adgang.

Microsoft Purview-politikker: Purview-politikker som dataadgangskontroller og følsomhedsetiketter gælder for datakilder, som agenter forespørger. Hvis en Purview-politik begrænser adgangen til et søhus eller lager, respekterer agenten denne begrænsning ved behandling af brugerforespørgsler.

Beskyttelse af udgående adgang: Fabric-dataagenter opererer inden for lejerens grænser for beskyttelse af udgående adgang. Udgående forbindelser fra agentoperationer er underlagt de samme netværks- og adgangsregler, der er konfigureret for din Fabric-lejer. Administratorer kan administrere tilladte udgående forbindelser via Fabric-administrationsportalen under lejerindstillinger for at kontrollere, hvilke eksterne endpoints-agenter kan nå.

Microsoft 365 Copilot-integration: Når Fabric-dataagenter bliver tilgængeligt via Microsoft 365 Copilot, fortsætter Purviews styringspolitikker med at gælde. Brugere kan kun få adgang til data, som deres legitimationsoplysninger og Purview-politikker tillader, uanset indgangspunktet.

ALM og DevOps for dataagenter

Fabric-dataagenter understøtter applikationslivscyklusstyringsfunktioner (ALM), som hjælper dig med at administrere agentkonfigurationer på tværs af udviklings-, test- og produktionsmiljøer.

Diagnostik: Brug indbygget diagnostik til at overvåge agentens adfærd, identificere problemer med forespørgselsgenerering og fejlfinde svarkvaliteten. Diagnostik giver indsigt i, hvordan agenten behandler spørgsmål og udvælger datakilder.

Git-integration: Du kan versionskontrollere dine agentkonfigurationer med Git-integration. Forbind dit Fabric-arbejdsområde til et Git-repository for at spore ændringer i agentinstruktioner, eksempelforespørgsler og valg af datakilder over tid.

Implementeringspipelines: Brug Fabric-deployment-pipelines til at fremme dataagenter på tværs af arbejdsområder (for eksempel fra udvikling til produktion). Denne support lader dig teste ændringer i et staging-miljø, før du gør dem tilgængelige for slutbrugere.

Operationelt tilsyn

For at opretholde løbende kvalitets- og politiktilpasning, overvej disse operationelle praksisser for din Fabric-dataagent:

  • Logging og audit: Overvåg agentinteraktioner gennem tilgængelige lognings- og revisionsfunktioner. At gennemgå forespørgselsmønstre og svarkvalitet hjælper dig med at identificere uventet adfærd tidligt.
  • Menneske-i-løkken eskalering: Etabler eskaleringsveje for følsomme eller højimpact-anmodninger. I situationer hvor automatiserede svar ikke er tilstrækkelige, definer processer, der sender spørgsmål videre til kvalificerede bedømmere.
  • Periodisk gennemgang: Gennemgå regelmæssigt dine instruktioner til dataagenten og eksempelforespørgsler for at sikre, at de forbliver i overensstemmelse med de nuværende organisatoriske politikker og datastrukturer. Efterhånden som dine datakilder eller forretningskrav ændrer sig, skal du opdatere agentkonfigurationen derefter.

Limitations

  • Fabric-dataagenten genererer kun SQL-, DAX- og KQL-"læse"-forespørgsler. Den genererer ikke SQL-, DAX- eller KQL-forespørgsler, der opretter, opdaterer eller sletter data.
  • Fabric-dataagenten understøtter ikke ustrukturerede data, såsom .pdf, .docxeller .txt filer. Du kan ikke bruge Fabric-dataagenten til at få adgang til ustrukturerede dataressourcer.
  • For lakehouse-datakilder besvarer Fabric-dataagenten spørgsmål ved hjælp af de lakehouse-tabeller, du vælger. Den læser ikke direkte selvstændige lakehouse-filer (for eksempel CSV- eller JSON-filer), medmindre de er indsamlet eller eksponeret som tabeller.
  • Fabric-dataagenten understøtter i øjeblikket ikke ikke-engelske sprog. For optimal ydeevne, giv spørgsmål, instruktioner og eksempelforespørgsler på engelsk.
  • Du kan ikke ændre den LLM, som Fabric-dataagenten bruger.
  • Samtalehistorikken i Fabric-dataagenten består ikke altid. I visse tilfælde, såsom ændringer i backend-infrastrukturen, serviceopdateringer eller modelopgraderinger, kan tidligere samtalehistorik blive nulstillet eller gå tabt.
  • Fabric-dataagenten kan ikke udføre forespørgsler, når datakildens arbejdsområdekapacitet er i en anden region end dataagentens arbejdsområdekapacitet. For eksempel fejler et søhus med kapacitet i Nordeuropa, hvis Data Agents kapacitet er i France Central.
  • Brugere kan levere op til 100 eksempelforespørgsler pr. datakilde i deres Data Agent.
  • Fabric Data Agents er i øjeblikket designet til samtaleindsigt frem for at returnere komplette datasæt. For at sikre præcise og effektive svar begrænser chat-output automatisk og/eller opsummerer de returnerede data. I øjeblikket er svarene begrænset til maksimalt 25 rækker og 25 kolonner. Bemærk venligst, at tidligere chathistorik kan påvirke efterfølgende svar. For eksempel, hvis du beder om at "vise alle rækker for i år," vil agenten stadig returnere maksimalt 25 rækker. Opfølgende spørgsmål kan derefter besvares baseret på denne allerede begrænsede kontekst, hvilket kan påvirke resultatet. I sådanne tilfælde anbefales det at starte en ny chatsession.
  • Agent-svar kan blive afkortet eller blokeret, hvis Microsoft Purview DLP eller adgangsrestriktioner gælder for de underliggende datakilder. Den specifikke adfærd afhænger af din organisations politikkonfiguration.
  • Aktiver, der er markeret som følsomme af Purview-politikker, kan være utilgængelige for agenten, hvilket kan resultere i ufuldstændige svar eller manglende mulighed for at forespørge visse datakilder.
  • Agentinteraktioner kan blive logget og tilgængelige via Microsoft Purview Audit og eDiscovery. Organisationer bør tage disse styringskontroller i betragtning, når de deployerer agenter til følsomme arbejdsbelastninger.
  • Adgang til Power BI semantiske modeller gennem en dataagent styres af læsetilladelse på modellen og kræver ikke adgang på arbejdsområdeniveau. Row-Level Security (RLS) og Column-Level Security (CLS) gælder stadig.