Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Si applica a:✅ Ingegneria dei dati e data science di Fabric
I pool live personalizzati sono cluster Spark preidratati che forniscono l'avvio di sessioni quasi istantanee per i notebook in Microsoft Fabric. Questo articolo illustra come creare, configurare e gestire pool live personalizzati per ottenere prestazioni ottimali.
Prerequisiti
Prima di configurare pool live personalizzati, assicurarsi di disporre di:
- Accesso a uno spazio di lavoro di Microsoft Fabric con uno SKU a pagamento di Fabric (le capacità di valutazione di Fabric non sono supportate)
- Ruolo di amministratore nell'area di lavoro
- Una capacità Fabric attiva assegnata all'area di lavoro
- Ambiente Fabric pubblicato da usare per la configurazione della libreria.
Importante
I pool di avvio non sono supportati per i pool live personalizzati. Se l'area di lavoro usa un pool di avvio, è necessario creare un pool di Spark personalizzato prima di configurare un pool live personalizzato.
Creare un pool personalizzato per il pool live
Creare prima di tutto un pool di Spark personalizzato. È possibile abilitare il calcolo del pool live in questo pool in un passaggio successivo.
- Passare all'area di lavoro Fabric.
- Selezionare Impostazioni area di lavoro dalla barra multifunzione principale dell'area di lavoro.
- Espandere Ingegneria dati/Scienza e selezionare Impostazioni Spark.
- Selezionare la scheda Pool .
- Nell'elenco a discesa Pool predefinito per l'area di lavoro selezionare Nuovo pool.
- Immettere un nome per il pool. Si tratta di un identificatore univoco per il pool (ad esempio, "dev-team-pool" o "prod-daily-analytics")
- Selezionare una famiglia di nodi e le dimensioni del nodo per il carico di lavoro.
- Selezionare la casella di controllo Scalabilità automatica per abilitare la scalabilità automatica per il pool.
- Impostare i nodi minimi su almeno 2.
Configurare un pool in tempo reale
Dopo aver creato un pool di Spark personalizzato, abilitare l'elaborazione in tempo reale del pool tramite le impostazioni dell'ambiente.
Nel tuo area di lavoro Fabric, apri l'ambiente da collegare a un pool personalizzato live.
Nel riquadro sinistro selezionare Calcolo.
Selezionare il pool creato nel passaggio precedente dall'elenco a discesa.
In Pool live selezionare il pulsante di opzione per attivare il calcolo del pool live per questo ambiente.
In Pianificazione pool live, selezionare il pulsante di scelta per attivare questa funzione. Tutti i pool live personalizzati devono avere una pianificazione. I cluster vengono mantenuti idratati solo durante la finestra pianificata.
Specificare le impostazioni di pianificazione:
- Se la programmazione è ricorrente
- Inizio e fine giorno e ora
- Fuso orario
- Quando disattivare e riattivare il pool
- Altre impostazioni applicabili
Importante
Fabric usa il provisioning Spark standard per l'attività all'esterno della finestra pianificata, con tempi di avvio più lenti. I cluster non vengono mantenuti caldi all'esterno della finestra pianificata.
Per suggerimenti sulla pianificazione, vedere Pianificare le procedure consigliate.
Salvare le impostazioni di calcolo.
Selezionare il pulsante Pubblica nella barra multifunzione superiore.
Dopo la pubblicazione, il pool è attivo e Fabric inizia a idratare i cluster prima del periodo di pianificazione successivo.
Annotazioni
La pubblicazione può richiedere alcuni minuti.
Le modifiche apportate all'ambiente richiedono la ripubblicazione dell'ambiente e l'aggiornamento dei cluster idratati.
Monitorare lo stato del pool
Per controllare lo stato del pool live personalizzato:
Nel portale Fabric, aprire l'hub di monitoraggio.
Trova l'ambiente che hai pubblicato e seleziona l'ellissi (...) per aprire il menu contestuale.
Selezionare Visualizza dettagli.
Nel riquadro destro, espandere Stato del pool live per visualizzare lo stato attuale del pool.
Lo stato del pool, in tempo reale, include dettagli come:
- Stato pool: ad esempio, Attivo, Idratazione, Inattivo o Fermato
- Cluster disponibili: numero di cluster pronti per le sessioni del notebook
- Cluster occupati: numero di cluster che attualmente gestiscono sessioni
- Pianificazione successiva: finestra attività imminente
Procedure consigliate
Per sfruttare al meglio i pool live personalizzati, prendere in considerazione le procedure consigliate seguenti per la configurazione e la gestione:
Ottimizzare i costi e le prestazioni
- Allinea conteggio con domanda: impostare il numero massimo di cluster in base alle sessioni simultanee previste. Il provisioning eccessivo aumenta i costi.
- Monitorare l'utilizzo: esaminare regolarmente le metriche del pool e regolare il numero di cluster, se necessario.
- Ridimensionare le pianificazioni in modo efficiente: evitare pianificazioni sovrapposte tra più pool, a meno che non sia necessario.
- Sfruttare il timeout di inattività: impostare i timeout di inattività appropriati per mantenere un equilibrio tra la disponibilità delle risorse ed evitare frequenti riavvii del cluster.
Ridimensionamento del cluster
Quando si configura il pool, prendere in considerazione le impostazioni e le raccomandazioni seguenti:
- Dimensioni del cluster: numero di istanze dell'executor per le sessioni del notebook (intervallo: 1-16).
- Numero massimo di cluster: numero massimo di cluster da mantenere idratati. Impostare in base alle sessioni simultanee previste.
- Timeout di inattività: per quanto tempo un cluster inutilizzato rimane allocato prima che Fabric lo termini.
| Tipo di carico di lavoro | Dimensioni consigliate | Descrizione |
|---|---|---|
| Analisi esplorativa | 2-4 core | Carichi di lavoro leggeri, esplorazione rapida dei dati |
| Calcolo medio | 8-12 nuclei | Report giornalieri, set di dati di medie dimensioni |
| Calcolo intensivo | 14-16 core | Set di dati di grandi dimensioni, trasformazioni complesse |
Gestire le dipendenze della libreria
- Usare il raggruppamento dell'ambiente: pre-installare librerie comuni nell'ambiente invece dell'installazione in tempo reale.
- Versionamento dell'ambiente: l'aggiornamento di un ambiente collegato richiede la ripubblicazione e la rigenerazione di cluster idratati.
- Aggiornare i cluster idratati: dopo aver apportato modifiche all'ambiente, aggiornare il pool o attendere il successivo ciclo pianificato per applicare le modifiche.
Adattarsi ai modelli di carico di lavoro
- Monitorare il comportamento esterno: regolare i timeout di inattività in base ai modelli di utilizzo effettivi.
- Condividere tra sessioni: valutare la possibilità di condividere lo stesso ambiente tra più pool se sono disponibili modelli di carico di lavoro coerenti per migliorare l'utilizzo delle risorse.
Pianificare le procedure consigliate
- Allinearsi ai modelli di carico di lavoro: Pianificare i tempi di attività quando il team esegue notebook interattivi o programmati.
- Tempo buffer: aggiungere 60-90 minuti prima delle finestre di utilizzo previste per garantire un'idratazione completa.
- Prendere in considerazione i fusi orari: se il team si estende su più fusi orari, estendere la pianificazione per coprire gli intervalli di tempo necessari.
Risoluzione dei problemi
La risoluzione dei problemi relativi ai pool live personalizzati comporta il controllo dello stato del pool, l'integrità dell'ambiente e la configurazione della pianificazione, come descritto negli scenari seguenti:
Il pool rimane non disponibile
Se il pool non riesce ad attivare o visualizzare lo stato "Non disponibile":
- Verificare che la capacità Fabric sia attiva e attualmente assegnata all'area di lavoro
- Verificare che l'ambiente collegato sia in stato "Pronto".
- Verificare che l'ambiente collegato sia pubblicato e non contenga errori.
L'idratazione richiede più tempo del previsto
Se l'idratazione è più lenta del previsto:
- Controllare le dipendenze dell'ambiente e lo stato della compilazione.
- Verificare che l'ambiente sia in stato "Pronto".
- Monitorare i dettagli del pool per ulteriori informazioni.
L'avvio di sessioni o notebook non riesce
Se le sessioni del notebook non si avviano anche con un pool attivo:
- Verificare che la sessione usi l'ambiente corretto.
- Verificare che la piscina sia in stato "Disponibile" e completamente idratata.