Del via


Transformér data ved at køre en notesbog

Brug aktiviteten Notebook til at køre notebooks du opretter i Microsoft Fabric som en del af dine Data Factory-pipelines. Med notesbøger kan du køre Apache Spark-job for at hente, rydde op i eller transformere dine data som en del af dine dataarbejdsprocesser. Det er nemt at tilføje en Notesbogsaktivitet til dine pipelines i Fabric, og denne guide guider dig gennem hvert trin.

Forudsætninger

For at komme i gang skal du fuldføre følgende forudsætninger:

Opret en notesbogaktivitet

  1. Opret en ny pipeline i dit arbejdsområde.

  2. Søg efter Notesbog i ruden Pipelineaktiviteter, og vælg den for at føje den til pipelinelærredet.

    Skærmbillede af Fabric UI med Aktiviteter-panelet og Notesbogsaktivitet markeret.

  3. Vælg den nye notesbogaktivitet på lærredet, hvis den ikke allerede er valgt.

    Skærmbillede, der viser fanen Generelle indstillinger i notesbogaktiviteten.

    Se vejledningen til generelle indstillinger for at konfigurere fanen Generelle indstillinger.

Konfigurer indstillinger for notesbog

Vælg fanen Indstillinger.

Under Forbindelse skal du vælge autentificeringsmetoden for notebook-kørslen og angive de nødvendige legitimationsoplysninger.

Vælg en eksisterende notesbog fra notesbogsmenuen , og angiv eventuelt eventuelle parametre, der skal sendes til notesbogen.

Skærmbillede, der viser fanen Indstillinger for notesbog, der fremhæver fanen, hvor du kan vælge en notesbog, og hvor du kan tilføje parametre.

Brug af Fabric Workspace Identity (WI) i Notebook-aktiviteten

  1. Opret Workspace-identiteten

    Du skal aktivere WI i dit arbejdsområde (det kan tage et øjeblik at indlæse). Opret en arbejdsområdeidentitet i dit Fabric-arbejdsområde. Bemærk, at WI skal oprettes i samme arbejdsområde som din Pipeline.

    Tjek dokumentationen om Workspace Identity.

  2. Aktiver lejerniveau-indstillinger

    Aktivér følgende lejerindstilling (den er deaktiveret som standard): Serviceprincipaler kan kalde Fabric offentlige API'er.

    Du kan aktivere denne indstilling i Fabric admin-portalen. For mere information om denne indstilling, se artiklen om enable service principal authentication for admin APIs.

  3. Giv workspace-tilladelser til Workspace Identity

    Åbn arbejdsområdet, vælg Administrer adgang, og tildel tilladelser til Workspace Identity. Bidragyderadgang er tilstrækkelig i de fleste scenarier. Hvis din Notebook ikke er i samme arbejdsområde som din Pipeline, skal du tildele den WI, du har oprettet i din Pipelines arbejdsområde, mindst bidragyderadgang til din Notebooks arbejdsområde.

    Tjek dokumentationen om Giv brugere adgang til arbejdsområder.

Angiv sessionsmærke

Hvis du vil minimere den tid, det tager at udføre notesbogjobbet, kan du eventuelt angive et sessionsmærke. Når du angiver sessionskoden, får Spark besked om at genbruge en eksisterende Spark-session, hvilket minimerer starttidspunktet. Alle vilkårlige strengværdier kan bruges til sessionskoden. Hvis der ikke findes en session, oprettes der en ny ved hjælp af kodeværdien.

Skærmbillede, der viser fanen Indstillinger for notesbog, der fremhæver fanen, hvor du kan tilføje sessionsmærke.

Bemærk

Hvis du vil kunne bruge sessionskoden, skal indstillingen Høj samtidighedstilstand for pipeline, der kører flere notesbøger, være slået til. Denne indstilling kan findes under tilstanden Høj samtidighed for Spark-indstillinger under indstillingerne for arbejdsområdet

Skærmbillede, der viser fanen Indstillinger for arbejdsområde, der fremhæver fanen, hvor du kan aktivere høj samtidighedstilstand for pipelines, der kører flere notesbøger.

Gem og kør eller planlæg pipelinen

Skift til fanen Hjem øverst i pipeline-editoren og vælg gem-knappen for at gemme din pipeline. Vælg Kør for at køre direkte eller Skemalæg for at planlægge løb på bestemte tidspunkter eller intervaller. For mere information om rørledningskørsler, se: planlæg rørledningskørsler.

Skærmbillede, der viser fanen Hjem i pipelineeditoren med tabulatornavnet, knapperne Gem, Kør og Planlæg fremhævet.

Efter kørsel kan du overvåge pipeline-udførelsen og se kørselshistorik fra fanen Output under lærredet.

Kendte problemer