Trasformare i dati eseguendo un notebook

Usare l'attività Notebook per eseguire notebooks creati in Microsoft Fabric come parte delle pipeline di Data Factory. I notebook consentono di eseguire processi Apache Spark per inserire, pulire o trasformare i dati come parte dei flussi di lavoro dei dati. È facile aggiungere un'attività notebook alle pipeline in Fabric e questa guida illustra ogni passaggio.

Prerequisiti

Per iniziare, è necessario soddisfare i prerequisiti seguenti:

È necessario avere accesso a un tenant di Microsoft Fabric con una capacità fornita. È possibile try Fabric con una versione di valutazione gratuita.
Un Fabric spazio di lavoro assegnato a tale capacità.

Un notebook è stato creato nell'area di lavoro. Per creare un nuovo notebook, vedere Come creare notebook Microsoft Fabric.

Creare un'attività nel quaderno

Creare una nuova pipeline nell'area di lavoro.
Cerca Notebook nel riquadro Attività della pipeline, e selezionalo per aggiungerlo al canvas della pipeline.
Selezionare la nuova attività Notebook nell’area di disegno, se non è già selezionata.

Fare riferimento alla guida alle impostazioni Generali per configurare la scheda impostazioni Generali.

Configurare le impostazioni del notebook

Selezionare la scheda Impostazioni .

In Connessione selezionare il metodo di autenticazione per l'esecuzione del notebook e specificare le credenziali necessarie.

Selezionare un notebook esistente dall'elenco a discesa Notebook e, facoltativamente, specificare eventuali parametri da passare al notebook.

Screenshot che mostra la scheda Impostazioni notebook che evidenzia la scheda, dove scegliere un notebook e dove aggiungere parametri.

Uso dell'identità di Fabric nell'attività Notebook

Creare l'identità dell'area di lavoro

È necessario abilitare La connessione Wi-On nell'area di lavoro (il caricamento potrebbe richiedere qualche minuto). Creare un'identità dell'area di lavoro nell'area di lavoro Fabric. Si noti che il WI deve essere creato nella stessa area di lavoro della tua pipeline.

Dai un'occhiata alla documentazione su Identità dell'area di lavoro.
Abilitare le impostazioni a livello di tenant

Abilitare l'impostazione del tenant seguente (disabilitata per impostazione predefinita): Le entità servizio possono chiamare le API pubbliche di Fabric.

È possibile abilitare questa impostazione nel portale di amministrazione di Fabric. Per altre informazioni su questa impostazione, vedere l'articolo sull'abilitazione dell'autenticazione del servizio principale per le API di amministrazione.
Concedere le autorizzazioni dell'area di lavoro all'identità dell'area di lavoro

Aprire l'area di lavoro, selezionare Gestisci accesso e assegnare le autorizzazioni all'identità dell'area di lavoro. L'accesso come collaboratore è sufficiente nella maggior parte degli scenari. Se il notebook non si trova nella stessa area di lavoro della pipeline, sarà necessario assegnare all'elemento di lavoro (WI) creato nell'area di lavoro della pipeline almeno i permessi da Collaboratore nell'area di lavoro del notebook.

Vedere la documentazione su Concedere agli utenti l'accesso alle aree di lavoro.

Impostare il tag di sessione

Per ridurre al minimo il tempo necessario per eseguire il processo del notebook, è possibile impostare facoltativamente un tag di sessione. L'impostazione del tag di sessione indica a Spark di riutilizzare qualsiasi sessione Spark esistente, riducendo al minimo il tempo di avvio. Qualsiasi valore stringa arbitrario può essere usato per il tag di sessione. Se non esiste alcuna sessione, ne verrà creato uno nuovo usando il valore del tag.

Screenshot che mostra la scheda delle Impostazioni del notebook con l'evidenziazione su dove aggiungere il tag di sessione.

Nota

Per poter utilizzare il tag di sessione, è necessario attivare l'impostazione di modalità ad alta concorrenza per l'esecuzione di pipeline che coinvolge più notebook. Questa opzione è disponibile nella modalità di concorrenza elevata per le impostazioni di Spark nelle impostazioni dell'area di lavoro

Salvare ed eseguire o pianificare la pipeline

Passare alla scheda Home nella parte superiore dell'editor della pipeline e selezionare il pulsante Salva per salvare la pipeline. Selezionare Esegui per eseguirla direttamente o Pianifica per pianificare le esecuzioni a intervalli o ore specifici. Per altre informazioni sulle esecuzioni della pipeline, vedere Pianificare le esecuzioni della pipeline.

Screenshot che mostra la scheda Home nell'editor della pipeline con il nome della scheda e i pulsanti Salva, Esegui e Pianifica evidenziati.

Dopo l'esecuzione, è possibile monitorare l'esecuzione della pipeline e visualizzare la cronologia di esecuzione dalla scheda Output sotto l'area di disegno.

Problemi noti

L'uso del principale del servizio per eseguire un notebook che contiene codice di collegamento semantico presenta limitazioni funzionali e supporta solo un sottoinsieme delle funzionalità di collegamento semantico. Per informazioni dettagliate, vedere le funzioni di collegamento semantico supportate . Per usare altre funzionalità, è consigliabile autenticare manualmente il collegamento semantico con un'entità servizio.

Come monitorare le esecuzioni delle pipeline

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-07