Automatiser agentevalueringer ved hjelp av API-en for Power Platform

Copilot Studio gir utviklere verktøy for kontinuerlig å evaluere agentytelsen ved å kjøre automatiserte tester mot forhåndsdefinerte testsett ved hjelp av rest-API-en for Power Platform. Ved hjelp av REST-API-en kan du programmatisk utløse agentevalueringer som en del av utviklingsarbeidsflytene, for eksempel under agentoppdateringer, utgivelsesvalidering eller regresjonstesting.

Automatisere evalueringer hjelper deg:

Valider agentkvalitet etter at du har gjort endringer
Kjør regelmessige ytelseskontroller mot produksjons- eller oppsamlingsagenter
Integrer agenttesting i CI/CD-datasamlebånd
Oppdage regresjoner i agentatferd tidlig i utviklingslivssyklusen

Forutsetninger

Du har bot-ID-en og miljø-ID-en for målagenten.
Et testsett opprettet i Copilot Studio for målagenten.
Et brukertilgangstoken utstedt av Microsoft Entra ID (OAuth 2.0). Hvis du vil hente tokenet, kan du se Godkjenning.
- Du må skaffe tilgangstokenet ved hjelp av klient-ID-en for en appregistrering som har riktig omfang gitt under API-en for Power Platform.
For Start en agentevaluering kan du eventuelt legge til en Microsoft Studio Connector-ID i samtalen som skal brukes som en brukerprofil for evalueringen. Slik finner dumcsConnectionId:
1. Gå til Power Automate.
2. Åpne Tilkoblinger-siden .
3. Velg Microsoft Copilot Studio-tilkoblingen.
4. mcsConnectionId Kopier fra nettadressen:.../connections/shared_microsoftcopilotstudio/{mcsConnectionId}/details

Oversikt over hvordan du kjører evalueringer ved hjelp av REST API

Følg disse generelle trinnene for å kjøre en evaluering ved hjelp av API-en for Power Platform:

Oppfylle forutsetningene.
Finn og hent testsett-ID-en for testsettet du vil bruke.
Kjør evalueringen.
Hent resultatene ved hjelp av evalueringskjørings-ID-en.

Når forespørselen er vellykket, kjører evalueringen asynkront og gir resultater som du kan se gjennom i Copilot Studio.

API-operasjoner for automatisere evalueringer

Copilot Studio støtter REST API-operasjoner som du kan bruke til programmatisk å utløse evalueringer mot agenten ved hjelp av et eksisterende testsett.

Få testsett for agenter

Endepunkt: GET https://api.powerplatform.com/copilotstudio/environments/{EnvironmentId}/bots/{BotId}/api/makerevaluation/testsets?api-version=2024-10-01
Formål: Hent en matrise med testsett-ID-er og andre detaljer for en bestemt agent.
Svar: Returnerer en liste kalt value testsett med følgende informasjon:
- auditInfo: Tidsstempler og bruker-ID-er for å opprette og endre hvert testsett
- displayName: Navnet på testsettet.
- id: ID-en for testsettet. Bruk i Start en agentevaluering for å velge hvilket testsett som skal brukes.
- description: Beskrivelsen av testsettet.
- state: Statusen for testsettet. Et brukbart testsett er Active.
- totalTestCases: Antall testtilfeller i testsettet.

Hent detaljer om agentens testsett

Endepunkt: GET https://api.powerplatform.com/copilotstudio/environments/{EnvironmentId}/bots/{BotId}/api/makerevaluation/testsets/{yourTestSetId}?api-version=2024-10-01
Formål: Hent detaljer for et bestemt testsett ved hjelp av testsett-ID-en.
Svar: Returnerer informasjonen for ett element i svarmatrisen Hent agenttestsett .

Finn ut mer i API-referansedokumentasjonen for Hent testsettdetaljer.

Starte en agentevaluering

Endepunkt: GET https://api.powerplatform.com/copilotstudio/environments/{EnvironmentId}/bots/{BotId}/api/makerevaluation/testsets/{yourTestSetId}/run?api-version=2024-10-01
Formål: Kjør en evaluering for et testsett ved hjelp av testsettets id. Du kan også inkludere en brukerprofil for godkjenning av tilkoblinger under evalueringskjøringen. Bruk mcsConnectionId denne til å angi brukerprofilen. Hvis du ikke legger til en mcsConnectionId samtale, kjøres evalueringen uten godkjenning. Se forutsetninger for hvordan du finner MCS-tilkoblings-ID-en.
Svar: Returnerer følgende informasjon:
- runId: ID-en for evalueringskjøringen. Bruk denne IDen til å hente evalueringsdetaljer.
- lastUpdatedAt: Når kjørestatusen sist ble oppdatert.
- executionState: Status for kjøringen mens evalueringen kjører.
- state: Nåværende tilstand til kjøringen.
- totalTestCases: Totalt antall testtilfeller i testsettet som brukes til evalueringen.
- testCasesProcessed: Totalt antall testtilfeller evaluert fra siste oppdatering.

Få detaljer om testkjøring for agent

Endepunkt: GET https://api.powerplatform.com/copilotstudio/environments/{EnvironmentId}/bots/{BotId}/api/makerevaluation/testruns/{yourTestRunId}?api-version=2024-10-01
Formål: Hent detaljene for en evaluering ved å bruke runId til å kjøre måloevalueringen.
Svar: Returnerer følgende informasjon:
- id: ID-en for evalueringskjøringen. Bruk denne IDen til å hente evalueringsdetaljer.
- environmentId: ID-en for miljøet til agenten din.
- cdsBotId: Målagentens ID.
- ownerId: ID-en til brukeren som startet evalueringskjøringen.
- testSetId: ID-en for testsettet som brukes til evalueringen.
- state: Fremdriftsstatusen for evalueringen.
- startTime: Da evalueringen startet.
- endTime: Når evalueringen er fullført (hvis den er fullført).
- name: Navnet på evalueringen.
- totalTestCases: Totalt antall testtilfeller i testsettet.
- mcsConnectionId: Tilkoblings-ID-en for Copilot Studio tilkobling til brukerprofilen som brukes til evalueringskjøringen. null hvis ingen brukerprofil er koblet til.
- testCasesResults: Listen over testtilfeller i evalueringskjøringen. Inkluderer:
  - testCaseId: ID-en til testtilfellet.
  - state: Fullføringsstatusen for testtilfellet.
  - metricsResults: Detaljene og resultatene for hver testmetode som brukes for testtilfellet. Inkluderer:
    - type: Testmetoden.
    - result: Det endelige resultatet av testen for dette testtilfellet. Inkluderer:
      - data: Detaljene for resultatet. Nøyaktige verdier avhenger av testmetoden. Finn ut mer i API-dokumentene for Power Platform. For en generell kvalitetstest inkluderer svaret:
        
        abstention: Om agenten svarte på spørringen.
        
        relevance: Om svaret var relevant.
        
        completeness: Om svaret er fullført.
    - status: Statusen til testtilfellet.
    - errorReason: Hvis det oppstod en feil, årsaken til feilen.
    - aiResultReason: Ai-forklaringen av testtilfelleresultatet.

Få agentens testkjøringer

Endepunkt: GET https://api.powerplatform.com/copilotstudio/environments/{EnvironmentId}/bots/{BotId}/api/makerevaluation/testruns?api-version=2024-10-01
Formål: Hente en matrise med alle tidligere kjøringer.
Svar: Hvert element i matrisen inneholder de samme verdiene som ble funnet i Hent agenttestkjøringsdetaljer.

Tilbakemeldinger

Var denne siden nyttig?

Last updated on 2026-04-14