Freigeben über


Agentische Workflows: Aufgabentreue (Vorschau)

Stellen Sie sicher, dass Ihre KI-Agents konsistent mit Benutzeranweisungen und Aufgabenzielen übereinstimmen. Das Signal zur Einhaltung von Aufgaben identifiziert Diskrepanzen, z. B. falsch ausgerichtete Toolaufrufe, falsche Werkzeugeingaben oder -ausgaben im Verhältnis zu Benutzerabsichten und Inkonsistenzen zwischen Antworten und Kundeneingaben. Diese Funktionalität ermöglicht es Systementwicklern, falsch ausgerichtete Aktionen proaktiv abzumildern, indem sie blockiert werden oder das Problem zur Prüfung durch einen Menschen weitergeleitet wird.

Die wichtigsten Ziele des Features "Aufgabentreue" sind:

  • So erkennen Sie Toolaktionen, die mit Benutzerzielen oder Eingabeabsicht falsch ausgerichtet sind, oder falsche Tooleingabe/-ausgabe relativ zu Benutzerabsichten oder Inkonsistenzen zwischen Agentantworten und Kundeneingaben.
  • Um eine Begründung bereitzustellen, wenn Toolaufrufe fehlerhaft sind.
  • Um ein Signal bereitzustellen, das nachgeschaltete Toolaufrufe blockieren und bei gefährdeter Aufgabenausrichtung eine Eskalation zur Überprüfung durch Menschen (Human-in-the-Loop, HITL) veranlassen kann.
  • Um das Vertrauen der Benutzer in agentische Systeme zu fördern, indem die Verhaltenskonsistenz, Transparenz und Kontrolle gestärkt werden.

Voraussetzungen

  • Ein Azure-Abonnement – Create one for free
  • Sobald Sie Ihr Azure-Abonnement haben, erstellen Sie eine Inhaltssicherheitsressource im Azure-Portal, um Ihren Schlüssel und Endpunkt abzurufen. Geben Sie einen eindeutigen Namen für Ihre Ressource ein, wählen Sie Ihr Abonnement aus, und wählen Sie eine Ressourcengruppe, Region und unterstützte Preisstufe aus. Wählen Sie dann Erstellen aus.
    • Die Bereitstellung der Ressource dauert einige Minuten. Wählen Sie im Anschluss Zu Ressource wechseln aus. Wählen Sie im linken Bereich unter Ressourcenverwaltung die Option Abonnementschlüssel und Endpunkt aus. Der Endpunkt und einer der Schlüssel werden verwendet, um APIs aufzurufen.
  • cURL installiert.

Anforderung

Hinweis

Ein Eingabeaufforderungsschildbeispiel finden Sie unter Eingabeaufforderungsschilde.

API-Version:2024-12-15-preview

Felder in der URL

Name Erforderlich Beschreibung Typ
Endpunkt Ja Die Basis-URL für die Inhaltssicherheits-API. Ersetzen Sie <endpoint> durch den Endpunkt, der für Ihren Azure Dienst bereitgestellt wurde. String
API-Version Ja Die version der zu verwendenden API. Für dieses Feature ist die Version 2024-12-15-preview. Beispiel: <endpoint>/contentsafety/agent:analyzeTaskAdherence?api-version=2024-12-15-preview String

Parameter im Anforderungstext

Name Erforderlich Beschreibung Typ
Werkzeuge Ja Eine Liste der Tools, die Funktionen definieren, die in der Aufgabe verwendet werden sollen. Jedes Tool enthält einen Typ (z. B. "Funktion") und Details zur Funktion, einschließlich name und Beschreibung. Array von JSON-Objekten
messages Ja Eine Liste der Nachrichten, die zwischen Dem Benutzer, Assistenten und Tools ausgetauscht werden. Jede Nachricht enthält die Quelle (z. B. "Eingabeaufforderung", "Abschluss"), Rolle (z. B. "Benutzer", "Assistent", "Tool"), Inhalt (Nachrichtentext) und optional toolCalls oder toolCallId. Array von JSON-Objekten

Beispiel für ein Anforderungstextschema

Die folgenden Tabellen sind Beschreibungen der Schlüsselfelder im Anforderungstext:

Feld "Werkzeuge"
Name Erforderlich Beschreibung Typ
Typ Ja Der Typ des verwendeten Tools. Für dieses Feature ist es „Funktion“ String
function.name Ja Der Name der Funktion. Beispiel: "read_emails" String
Funktion.beschreibung Ja Eine kurze Beschreibung der Funktion. Beispiel: "Liest die E-Mails des Benutzers" String
Nachrichtenfeld
Name Erforderlich Beschreibung Typ
Quelle Ja Der Ursprung der Nachricht. Mögliche Werte: "Prompt", "Vervollständigung" String
role Ja Die der Nachricht zugeordnete Rolle. Mögliche Werte: "Benutzer", "Assistent", "Werkzeug" String
contents Ja Der Inhalt der Nachricht. Beispiel: "Meine E-Mails zusammenfassen" Zeichenfolge oder Array
Werkzeugaufrufe No Eine Liste von Toolaufrufen des Agents, einschließlich Typ (z. B. "Funktion"), function.name, function.arguments und einer eindeutigen ID. Array von JSON-Objekten
toolCallId No (Für Toolnachrichten) Die ID des Toolaufrufs, auf den geantwortet wird. Entspricht der ID, die im Toolaufruf des Agents angegeben wird. String

API-Antwort

Nachdem Sie Ihre Anfrage übermittelt haben, erhalten Sie JSON-Daten, die die Analyse widerspiegeln, die durch Task Adherence durchgeführt wurde. Diese Daten kennzeichnen potenzielle Sicherheitsrisiken innerhalb Ihres Agentworkflows. So sieht eine typische Ausgabe aus:

{
  "taskRiskDetected": true,
  "details": "Agent attempts to share a document externally without user request or confirmation."
}
Name Beschreibung Typ
AufgabenrisikoErkannt Enthält Ergebnisse der Risikoerkennung für die Eingabe Boolean
details Gibt die Begründung zurück, wenn ein Risiko erkannt wird String

Ein Wert von true für taskRiskDetected zeigt ein erkanntes Risiko an. In diesem Fall empfehlen wir eine Überprüfung und entsprechende Maßnahmen, wie das Blockieren der Anforderung zum Toolaufruf oder eine Eskalation zur Überprüfung durch Menschen.

Voraussetzungen

Ein Azure Konto. Wenn Sie noch keines besitzen, können Sie es kostenlos erstellen. Eine Azure KI-Ressource.

Einrichten und Verwenden der Aufgabentreue

Führen Sie die folgenden Schritte aus, um die Seite "Inhaltssicherheit ausprobieren " zu verwenden:

  1. Wechseln Sie zu Azure AI Foundry , und navigieren Sie zu Ihrem Projekt/Hub. Wählen Sie dann auf der linken Navigationsleiste die Registerkarte "Guardrails + controls " aus, und wählen Sie die Registerkarte "Ausprobieren" aus.
  2. Auf der Seite "Ausprobieren " können Sie mit verschiedenen Guardrails & Controls-Features wie Text und Bildinhalten experimentieren, indem Sie anpassbare Schwellenwerte verwenden, um nach schädlichen Inhalten zu filtern.
  3. Navigieren Sie zu "Agentischer Workflow" , und wählen Sie " Aufgabentreue" aus.
  4. Du kannst eines der Beispiele mit korrekt oder fehlerhaft ausgerichteten Agent-Toolaufrufen auswählen oder eigene erstellen, um die Aufgabentreue zu testen.
  5. Wählen Sie "Test ausführen" aus. Die Einhaltung der Aufgabe gibt die Risikokennzeichnung für jedes Beispiel zurück, und wenn ein Risiko erkannt wird, wird ein Grund zurückgegeben.

Benutzerszenarien

Kundendienst

Szenario: Ein in eine Unternehmensplattform integriertes Kundensupport-Assistent hilft Benutzern, die Datennutzung zu überprüfen, Probleme zu beheben und Kontoeinstellungen zu verwalten. Um die präzise Automatisierung aufrechtzuerhalten, integriert das System die Aufgabeneinhaltung, um Agentenpläne zu validieren, bevor Backend-Toolaufrufe ausgeführt werden.

Benutzer: Endbenutzer, Supportmitarbeiter und Kundenerfahrungsteams.

Aktion: Ein Benutzer sagt dem Chatbot: "Können Sie überprüfen, wie viele Daten ich in diesem Monat verwendet habe?" Der Assistent plant, ein change_data_plan() Tool aufzurufen. Die Einhaltung der Aufgabe erkennt eine Fehlausrichtung zwischen der Absicht des Benutzers (Informationsanforderung) und der vorgeschlagenen Aktion (Abonnementänderung). Der Aufruf des Tools kann blockiert werden, und das System hält entweder die Ausführung an oder fordert den Benutzer zur Überprüfung auf.

Personalverwaltung

Szenario: Ein Unternehmensassistent automatisiert routinemäßige HR-bezogene Workflows wie Buchungsurlaub, Übermittlung von Ausgaben und Überprüfen von Richtliniendetails. Durch die Aufgabeneinhaltung wird sichergestellt, dass die Maßnahmen der Agenten innerhalb des erwarteten Bereichs bleiben und keine unbeabsichtigten Abkürzungen gemacht werden.

Benutzer: Mitarbeiter, HR-Geschäftspartner und Workflowautomatisierungs-Teams.

Aktion: Ein Mitarbeiter gibt folgendes ein: "Ich möchte wissen, wie viel Jahresurlaub ich noch habe." Der Agent plant, apply_leave() aufzurufen. Die Aufgabenkonformität identifiziert eine Aufgabenabweichung – der Benutzer hat nach Informationen gefragt, nicht um einen Prozess zu starten. Die Ausführung wird blockiert; der Agent formuliert neu oder fordert zur Bestätigung auf.

Produktivitätstools

Szenario: Ein in eine E-Mail-Plattform eingebetteter Produktivitätsassistent hilft Fachleuten, eine Verbindung mit Datenbanken herzustellen und Nachrichten zu entwerfen, zu überprüfen und zu senden. Die Aufgabentreue wird verwendet, um zwischen dem Schreiben eines Entwurfs und dem Ausführen eines Sendebefehls zu unterscheiden, insbesondere in Fällen, in denen die Benutzerabsicht mehrdeutig ist.

Benutzer: Wissensarbeiter, Leitende Assistenten und IT-Compliance-Teams.

Aktion: Der Benutzer fordert Folgendes auf: "Schreiben Sie eine E-Mail an den Client über den verpassten Stichtag.". Der Agent generiert eine Nachricht und plant, aufzurufen send_email(). Die Aufgabentreue kennzeichnet den Plan als potenziell verfrüht; es gibt keine explizite Anweisung zum Senden. Das System blockiert stattdessen den vorgesehenen Toolaufruf und fordert die Benutzerüberprüfung auf.

Aufgabenbefolgung: Ausgerichtete vs. fehlausgerichtete Werkzeugnutzung

Das Api-Signal zur Einhaltung von Aufgaben hilft Entwicklern und Plattformbesitzern zu verstehen, wann der Toolaufruf eines Agents übereinstimmt oder von der Absicht des Benutzers abweicht.

Beispiele

Klassifizierung Beschreibung Beispiel
Ausgerichtet Der Agent ruft angeforderte Informationen ab, ohne unbeabsichtigte Aktionen auszuführen. Benutzer: "Können Sie mir meine letzten Kalenderereignisse anzeigen?"
Geplantes Tool:get_calendar_events()
✅ Der Agent ruft Ereignisse wie angefordert ab.

Ausgabe:
{ "taskRiskDetected": false }
Fehlausrichtung Der Agent versucht, Die Benutzereinstellungen zu ändern, wenn nur eine Informationsanforderung gestellt wurde. Benutzer: "Können Sie mir meine letzten Kalenderereignisse anzeigen?"
Geplantes Tool:clear_calendar_events()
❌ Der Agent bereitet sich auf das Löschen von Daten vor.

Ausgabe:
{ "taskRiskDetected": true, "details": "Planned action deletes calendar events, but user only requested to view them."}
Ausgerichtet Der Agent beginnt einen Dokumenterstellungsablauf nach Benutzeranforderungen zum Generieren eines neuen Dokuments. Benutzer: "Erstellen Eines neuen Projektvorschlagsdokuments für den Kunden."
Geplantes Tool:create_document()
✅ Entspricht der Aufgabenanforderung des Benutzers.

Ausgabe:
{ "taskRiskDetected": false}
Fehlausrichtung Agent teilt das Dokument mit externen Mitarbeitern ohne Benutzeranweisung. Benutzer: "Erstellen Eines neuen Projektvorschlagsdokuments für den Kunden."
Geplantes Tool:share_document()
❌ Keine Benutzeranleitung zum Teilen.

Ausgabe:
{ "taskRiskDetected": true, "details": "Agent attempts to share a document externally without user request or confirmation."}

Einschränkungen

Verfügbare Sprachen

Die Aufgabentreue wurde auf Text in Englisch getestet; Das Feature kann jedoch in vielen anderen Sprachen funktionieren, obwohl die Qualität variieren kann. In allen Fällen empfehlen wir tests für Ihren Anwendungsfall und Ihre Anwendung, um sicherzustellen, dass sie für Ihre Szenarien funktioniert.

Textlängenbeschränkung

Derzeit hat die Api zur Aufgabenbefolgung Einschränkungen bei der Eingabelänge. Die maximale Textlänge beträgt 100.000 Zeichen. Wenn die Eingabelänge diese Einschränkung überschreitet, wird eine Fehlermeldung angezeigt.

Verfügbarkeit von Regionen und Datenverarbeitung

Während die Einhaltung der Aufgaben in allen Azure KI Inhaltssicherheit-Regionen aktiviert werden kann, können Daten in anderen US- und EU-Regionen außerhalb der angegebenen Geo weitergeleitet und verarbeitet werden.