Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gilt für:✅ Fabric Data Engineering und Data Science
Benutzerdefinierte Livepools sind vorgewärmte Spark-Cluster, die einen nahezu sofortigen Sitzungsstart für notizbuchbasierte Workloads in Microsoft Fabric bereitstellen. Anstatt bei jedem Durchlauf auf die Clusterbereitstellung zu warten, halten benutzerdefinierte Live-Pools Cluster innerhalb eines konfigurierten Zeitfensters warm und ermöglichen Startzeiten von 5 Sekunden für Ihre interaktiven und geplanten Notizbücher.
Gründe für die Verwendung von benutzerdefinierten Livepools
Standard Spark-Sitzungen in Fabric erfordern die Bereitstellung von Clustern jedes Mal, wenn eine Sitzung startet. Für Teams, die häufig Notebooks ausführen – ob interaktiv, geplant oder durch eine Pipeline ausgelöst – kann diese Bereitstellungszeit die Iterationszyklen verlangsamen und die Gesamtjoblatenz erhöhen.
Benutzerdefinierte Livepools lösen dies durch:
- Vorab-Übertragung von Clustern basierend auf einem benutzerdefinierten Zeitplan, damit die Berechnung bereit ist, wenn Arbeitslasten eintreffen.
- Erlaubt eine präzise Kontrolle über die Anzahl der warmgehaltenen Cluster und die Umgebung, die für die Bibliothekskonfiguration verwendet wird.
- Die Bereitstellung eines konsistenten Startverhaltens (~5 Sekunden) für alle unterstützten Notizbuchsitzungstypen während des geplanten Zeitfensters.
Benutzerdefinierte Livepools ergänzen die vorhandenen Startpool- und benutzerdefinierten Spark-Pooloptionen in Fabric:
| Rechenoption | Startzeit | Zeitplanbasiert | Benutzerdefinierte Bibliotheken | Unterstützte Workloads |
|---|---|---|---|---|
| Starterpools | 5 bis 10 Sekunden (ohne Bibliotheken) | No | No | Notizbücher, SJD |
| Benutzerdefinierte Sparkpools | ~1 Min. | No | Durch die Umgebung | Notizbücher, SJD |
| Benutzerdefinierte Livepools | ~5 Sekunden bis 10 Sekunden (nach Abschluss der Hydratation) | Ja | Über die Umgebung | Nur Notebooks (interaktiv und geplant) |
Wichtige Konzepte
Die folgenden Konzepte erläutern, wie benutzerdefinierte Livepools funktionieren, einschließlich der Vorbereitung von Clustern, wann sie verfügbar sind und wie Die Kapazitäts- und Bibliothekskonfiguration verwaltet wird.
Hydratation und Aufwärmen
Wenn Sie einen benutzerdefinierten Livepool erstellen und veröffentlichen, beginnt Fabric vor dem geplanten Fenster mit der Hydratisierung von Clustern. Hydratation bedeutet, dass Cluster vollständig bereitgestellt, mit der angefügten Umgebung konfiguriert und warm gehalten werden, bis eine Sitzungsanfrage eingeht.
Die ~5-Sekunden-Startzeit ist erst verfügbar, nachdem der Pool vollständig hydratisiert ist. Während der ersteinrichtung oder unmittelbar nach einer Konfigurationsänderung können Sitzungen längere Startzeiten erleben, während die Hydratation abgeschlossen ist. Informationen zur Problembehandlung finden Sie unter Hydrationsprozess dauert länger als erwartet.
Sendepläne
Jeder benutzerdefinierte Livepool erfordert einen Zeitplan, der definiert, wann der Pool aktiv ist. Cluster werden nur während des geplanten Zeitfensters warm gehalten, und die Abrechnung erfolgt nur, solange Cluster zugewiesen sind. Wenn der Zeitplan abläuft oder ein Cluster leer ist, der über den konfigurierten Schwellenwert hinausgeht, bricht Fabric die Zuordnung ab, und die Abrechnung wird beendet.
Planen Sie Ihre Zeitpläne so, dass Ihre erwarteten Arbeitsauslastungsfenster abgedeckt werden, damit die verfügbare Rechenleistung abrufbar ist, wenn Ihr Team sie benötigt. Konfigurationsschritte und bewährte Methoden finden Sie unter Konfigurieren eines Livepools.
Umgebungsanhang
Jeder benutzerdefinierte Livepool ist an eine Fabric-Umgebung angefügt. Die Umgebung steuert, welche Bibliotheken auf hydratisierten Clustern vorinstalliert sind. Zum Aktualisieren von Bibliotheken müssen Sie die Umgebung ändern und erneut veröffentlichen. Vorhandene hydratisierte Cluster werden erst mit den neuen Bibliotheken aktualisiert, wenn die nächste geplante Hydratation oder eine manuelle Aktualisierung erfolgt. Konfigurationsschritte finden Sie unter Konfigurieren eines Livepools.
Veröffentlichungsmodi für Bibliotheken
Der Bibliotheksveröffentlichungsmodus in der angefügten Umgebung bestimmt, wie Bibliotheken an hydratisierte Cluster bereitgestellt werden:
- Vollmodus: Bibliotheken werden während der Veröffentlichung der Umgebung aufgelöst und in das hydratisierte Clusterimage eingebettet. Wenn eine Sitzung startet, ist die Momentaufnahme im Vollmodus bereits im Cluster vorhanden, was etwa 5-sekündige Sitzungsstarts ermöglicht. Verwenden Sie den vollständigen Modus, wenn Sie eine stabile, reproduzierbare Bibliothek benötigen und der schnellstmögliche Sitzungsstart erforderlich ist.
- Schnellmodus: Bibliotheken werden nicht auf hydratisierten Clustern vorinstalliert. Stattdessen werden sie installiert, wenn die Notizbuch-Sitzung beginnt. Hydratisierte Cluster bieten weiterhin eine schnelle Rechenzuweisung, aber die Bibliotheksinstallation beim Sitzungsstart erfordert zusätzliche Zeit. Verwenden Sie den Schnellmodus für eine schnelle Iteration während der Entwicklung, wenn die Bibliotheksstabilität weniger kritisch ist.
Hinweis
Der Ordner "NotizbuchRessourcen" und Inlinebibliotheksinstallationen (z. B. %pip install in einer Codezelle) sind manuelle Ansätze pro Sitzung. Sie sind unabhängig vom Veröffentlichungsmodus der Umgebung und wirken sich nicht darauf aus, welche Bibliotheken auf hydratisierten Clustern vorinstalliert sind.
Clusterkapazität
Jeder Pool verfügt über eine maximale Clusteranzahl, die Sie während der Konfiguration festgelegt haben. Fabric skaliert den Pool nicht automatisch über diesen Wert hinaus. Wenn alle betankten Cluster verwendet werden, greifen zusätzliche Jobs auf die On-Demand-Bereitstellung zurück, was je nach Abhängigkeiten der Bibliothekspakete etwa 3 bis 5 Minuten oder länger dauern kann. Anleitungen zur Größenbestimmung finden Sie unter Cluster-Größenanpassung.
Unterstützte Workloads
Benutzerdefinierte Livepools unterstützen die folgenden notizbuchbasierten Spark-Sitzungstypen:
- Interaktive Notizbücher werden über das Fabric-Portal ausgeführt
- Geplante Notizbuchläufe werden im Notizbuch-Planer konfiguriert
- Notebook-Abläufe, die durch Pipelines ausgelöst werden
Hinweis
Spark Job Definitions (Batchaufträge) werden in der aktuellen Version von benutzerdefinierten Livepools nicht unterstützt.
Kapazität und Lizenzierung
Benutzerdefinierte Livepools erfordern eine kostenpflichtige Microsoft Fabric-Kapazitäts-SKU. Fabric-Testkapazitäten werden derzeit nicht unterstützt.
Informationen zu verfügbaren Kapazitäts-SKUs finden Sie unter Microsoft Fabric-Konzepte und -Lizenzen.
Zugriffskontrolle
Arbeitsbereichsrollenzuweisungen steuern den Zugriff auf die konfiguration und den Status eines benutzerdefinierten Livepools:
| Rolle | Erlaubnisse |
|---|---|
| Viewer oder Mitglied | Schreibgeschützter Zugriff auf Poolstatus und Konfiguration |
| Administrator | Vollständige Konfiguration, Speichern und Veröffentlichen von Berechtigungen |
B2B-Gastbenutzern muss eine explizite Arbeitsbereichsrolle zugewiesen werden, um mit benutzerdefinierten Livepools zu interagieren.
Einschränkungen
Die folgenden Einschränkungen gelten für benutzerdefinierte Livepools in der aktuellen Version:
- Sitzungen beginnen in ~5 Sekunden nur, nachdem der Pool vollständig hydratisiert wurde. Bei der ersteinrichtung oder nach dem Ändern der Konfiguration sind startzeiten möglicherweise länger.
- Bibliotheksänderungen erfordern eine erneute Veröffentlichung der angefügten Umgebung. Hydratisierte Cluster werden nicht automatisch aktualisiert.
- Wenn die angefügte Umgebung den Schnellmodus für einige Bibliotheken verwendet, werden diese Bibliotheken nicht auf hydratisierten Clustern vorinstalliert und müssen beim Sitzungsstart installiert werden. Verwenden Sie für den schnellsten Sitzungsstart mit benutzerdefinierten Livepools den vollständigen Modus für Ihre Bibliotheksabhängigkeiten.
- Es werden nur Notizbuchbasierte Spark-Sitzungen unterstützt. Spark-Auftragsdefinitionen werden nicht unterstützt.
- Fabric-Testkapazitäten werden nicht unterstützt.
- Jeder Pool muss über einen Zeitplan verfügen. Pools ohne Zeitplan können nicht veröffentlicht werden.
- Benutzerdefinierte Livepools können nicht über öffentliche APIs oder CI/CD-Pipelines der Umgebung verwaltet werden. Die Konfiguration muss über das Fabric-Portal ausgeführt werden.