Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Von Bedeutung
Dieses Feature befindet sich in der Betaversion. Kontoadministratoren können den Zugriff auf dieses Feature über die Seite " Vorschau" der Kontokonsole steuern. Siehe Manage Azure Databricks Previews.
Auf dieser Seite wird beschrieben, wie KI-Gateway -Endpunkte (Beta) konfiguriert werden.
Anforderungen
- Ai Gateway (Beta)-Vorschau für Ihr Konto aktiviert. Siehe Manage Azure Databricks Previews.
- Ein Azure Databricks Arbeitsbereich in einem AI-Gateway (Beta) unterstützter Region.
- Unity-Katalog für Ihren Arbeitsbereich aktiviert. Weitere Informationen finden Sie unter Aktivieren eines Arbeitsbereichs für Unity Catalog.
Erstellen eines AI-Gateway-Endpunkts
So erstellen Sie einen AI-Gateway-Endpunkt:
- Klicken Sie in der Randleiste auf AI-Gateway.
- Klicken Sie auf " AI-Gatewayendpunkt erstellen".
- Konfigurieren Sie den Endpunktnamen und das primäre Modell.
- Klicken Sie auf "Erstellen".
Konfigurieren von Features auf einem Endpunkt
Sie können AI-Gateway-Endpunkte aktualisieren, um Features zu aktivieren und zu deaktivieren. Aktualisierungen von AI-Gatewaykonfigurationen dauern bis zu 1 Minute.
So aktualisieren Sie KI-Gateway-Features auf einem vorhandenen Endpunkt:
- Klicken Sie auf Der Seite "AI-Gateway" auf Ihren Endpunkt.
- Klicken Sie in der Randleiste für Gateway-Endpunktdetails auf das Bearbeitungssymbol neben dem Feature, das Sie aktualisieren möchten.
- Nehmen Sie Ihre Änderungen vor, und klicken Sie auf "Speichern".
In der folgenden Tabelle sind die verfügbaren KI-Gateway-Features und deren Konfiguration zusammengefasst:
| Merkmal | Wie konfiguriert man | Einzelheiten |
|---|---|---|
| Nutzungsnachverfolgung | Standardmäßig aktiviert. |
|
| Ableitungstabellen | Wählen Sie "Rückschlusstabellen aktivieren" aus, um Anforderungen und Antworten zu protokollieren. |
|
| Ratenbegrenzungen | Wählen Sie "Ratelimits " aus, um Abfragen pro Minute (QPM) oder Token pro Minute (TPM) zu konfigurieren. |
|
| Leitplanken | Wählen Sie "Guardrails" aus, um Inhaltsrichtlinien zu konfigurieren. |
|
| Fallbacks | Wählen Sie "Fallbackmodell hinzufügen" aus, um Fallbackmodelle zu konfigurieren. |
|
| Aufteilung des Datenverkehrs | Wählen Sie "Traffic-Splitting hinzufügen" aus, um Anforderungen über mehrere Modell-Backends zu verteilen. |
|
| Benutzerdefinierte APIs | Wählen Sie benutzerdefinierte API aus, wenn Sie einen Endpunkt zum Herstellen einer Verbindung mit einer externen API erstellen. |
|
Das folgende Diagramm zeigt ein Fallbackbeispiel, in dem drei Modelle als Ziele eines AI-Gateway-Endpunkts registriert sind:
- Die Anforderung wird ursprünglich an Modell 1 weitergeleitet.
- Wenn die Anforderung eine Antwort von 200 zurückgibt, war die Anforderung auf Modell 1 erfolgreich, und die Anforderung und ihre Antwort werden in den Tabellen für die Verwendungsnachverfolgung und -ableitung protokolliert.
- Wenn die Anforderung einen
429oder5XXFehler bei Modell 1 zurückgibt, wird auf das nächste Modell am Endpunkt, Modell 2, zurückgegriffen. - Wenn die Anforderung einen
429oder5XXFehler auf Modell 2 zurückgibt, wird auf das nächste Modell, Modell 3 am Endpunkt, zurückgegriffen. - Wenn die Anforderung einen
429Fehler für5XXModell 3 zurückgibt, schlägt die Anforderung fehl, da alle Fallbackmodelle ausprobiert wurden. Die fehlgeschlagene Anforderung und der Antwortfehler werden in den Tabellen zur Verwendungsnachverfolgung und -ableitung protokolliert.