Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Il notebook Microsoft Fabric è un elemento di codice principale per lo sviluppo di processi Apache Spark e esperimenti di Machine Learning. Si tratta di un'interfaccia interattiva basata sul web utilizzata da scienziati dei dati e ingegneri dei dati per scrivere codice che trae vantaggio da visualizzazioni ricche e testo Markdown. I data engineer scrivono codice per l'inserimento dei dati, la preparazione dei dati e la trasformazione dei dati. I data scientist usano anche notebook per creare soluzioni machine learning, tra cui la creazione di esperimenti e modelli, il rilevamento dei modelli e la distribuzione.
Con un notebook Fabric è possibile:
- Inizia senza alcuno sforzo di configurazione.
- Esplorare ed elaborare facilmente i dati con un'esperienza intuitiva con poco codice.
- Mantenere i dati protetti con le funzionalità di sicurezza aziendali predefinite.
- Analizzare i dati in formati non elaborati (CSV, txt, JSON e così via), formati di file elaborati (Parquet, Delta Lake e così via), usando le potenti funzionalità di Spark.
- Sii produttivo grazie a capacità avanzate di creazione di contenuti e visualizzazione dei dati predefinite.
- Sfruttare Copilot per la generazione di codice compatibile con il contesto, il refactoring e la convalida nel notebook.
- Diagnostica e ripara rapidamente le celle non riuscite o i processi Spark con Correggi con Copilot, incluse le modifiche al codice basate sull'approvazione.
Questo articolo descrive come usare i notebook nelle esperienze di data science e ingegneria dei dati.
Contesto di sicurezza dell'esecuzione del notebook
L'esecuzione del notebook può essere attivata in tre modi, ognuna con un contesto di sicurezza diverso:
- Esecuzione interattiva: si attiva manualmente l'esecuzione tramite l'interfaccia utente o l'API REST. Il notebook viene eseguito nel contesto di sicurezza dell'utente corrente (il tuo contesto di sicurezza).
- Esegui come attività pipeline: l'esecuzione viene attivata da una pipeline di Fabric Data Factory. Vedere Attività notebook per informazioni dettagliate. Il notebook viene eseguito con l'identità dell'utente che ha modificato per ultimo la pipeline, non il proprietario della pipeline o il proprietario del notebook. Ciò significa che chiunque abbia modificato l'ultima pipeline determina il contesto di sicurezza per i dati access, le chiamate API e le autorizzazioni.
- Utilità di pianificazione: l'esecuzione viene attivata da un'esecuzione pianificata. Il notebook viene eseguito con l'identità dell'utente che ha creato la pianificazione o l'ha aggiornata di recente.
Queste opzioni di esecuzione offrono flessibilità per diversi scenari, ma è necessario comprendere l'identità che esegue il notebook. Il contesto di sicurezza influisce sulle autorizzazioni di accesso ai dati, sull'autorizzazione delle chiamate API e sulla disponibilità delle risorse. Alcune API, come gli endpoint T-SQL, non supportano le identità di servizio e richiedono un'identità utente.
La prima volta che viene creato un notebook, viene visualizzato un messaggio di avviso per ricordare il rischio di eseguire il codice senza esaminarlo.
Seguire queste procedure consigliate per evitare problemi di sicurezza:
- Prima di eseguire manualmente un notebook: controllare chi ha modificato l'ultimo notebook e usare il pannello della cronologia delle versioni per esaminare le modifiche effettive del contenuto prima di eseguire il codice non scritto.
- Prima di aggiungere un notebook a una pipeline: verificare chi ha modificato la pipeline per l'ultima volta, perché il notebook viene eseguito con l'identità dell'utente. Aprire il notebook dalla pipeline per esaminare il contenuto più recente. Se l'identità non dispone delle autorizzazioni necessarie (o se è necessaria un'entità utente anziché un'entità di servizio per determinate API), chiedere all'utente appropriato di modificare la pipeline per aggiornare l'identità che ha effettuato l'ultima modifica.
- Prima di creare o aggiornare una pianificazione: il notebook opera sotto l'identità di chi crea o aggiorna la pianificazione. Assicurarsi che l'utente disponga delle autorizzazioni necessarie per tutte le operazioni nel notebook.
- Usare le fasi dell'area di lavoro: separare le aree di lavoro in fasi di sviluppo, test e produzione. Limitare access alle aree di lavoro di produzione solo agli utenti attendibili.
Creare quaderni
È possibile creare un nuovo notebook o importare un notebook esistente.
Creare un nuovo notebook
Analogamente ad altri processi di creazione di elementi Fabric standard, è possibile creare facilmente un nuovo notebook dall'opzione Fabric Data Engineering, dall'area di lavoro New o dall'opzione Crea hub.
Per istruzioni dettagliate sulla creazione di notebook in flussi di lavoro specifici, vedere:
- Esplora i dati nel lakehouse con un notebook per creare un notebook nel contesto di un lakehouse nel portale di Fabric.
- notebook Author in Microsoft Fabric con Visual Studio Code per la creazione di notebook da VS Code.
- API pubbliche per i notebook per la creazione di notebook tramite API REST.
Importare notebook esistenti
È possibile importare uno o più notebook esistenti dal computer locale usando l'opzione nella barra degli strumenti dell'area di lavoro. I notebook Fabric riconoscono i file standard Jupyter Notebook .ipynb e i file di origine come .py, .scala e .sql e creano di conseguenza nuovi elementi del notebook.
Esportare un notebook
È possibile esportare il notebook in altri formati standard. Il notebook Fabric può essere esportato in:
Salvare un notebook
In Fabric, un notebook verrà salvato automaticamente dopo l'apertura e la modifica. Non è necessario preoccuparsi di perdere le modifiche al codice. È anche possibile usare Salva una copia per clonare un'altra copia nell'area di lavoro corrente o in un'altra area di lavoro.
Se si preferisce salvare manualmente un notebook, è possibile passare all'opzione di salvataggio Manuale per avere un ramo locale dell'elemento del notebook e quindi usare Salva o CTRL+S per salvare le modifiche.
È possibile passare alla modalità di salvataggio manuale anche selezionando Modifica ->Salva opzioni ->Manuale. Per attivare un ramo locale del notebook e quindi salvarlo manualmente, selezionare Salva o usare l’abbreviazione da tastiera CTRL+S.
Connettere lakehouse e notebook
I taccuini di Fabric ora supportano interazioni strette con i lakehouse; è possibile aggiungere facilmente un nuovo lakehouse o uno esistente dall'Esploratore Lakehouse.
È possibile passare a diversi lakehouse in Esplora lakehouse e impostare un lakehouse come predefinito bloccandolo. Il lakehouse predefinito viene quindi montato nella directory di lavoro del runtime ed è possibile leggere o scrivere nel lakehouse predefinito usando un percorso locale.
Nota
Dopo aver aggiunto un nuovo lakehouse o dopo aver rinominato il lakehouse predefinito, è necessario riavviare la sessione.
Aggiungere o rimuovere un lakehouse
Selezionando l'icona X accanto al nome di un lakehouse, il lakehouse viene rimosso dalla scheda del notebook, ma l'elemento lakehouse rimane nell'area di lavoro.
Selezionare Aggiungi lakehouse per aggiungere altri lakehouse al notebook, aggiungendone uno esistente o creando un nuovo lakehouse.
Esplorare un file lakehouse
La sottocartella e i file nella sezione Tabelle e File della visualizzazione Lake appaiono in un'area di contenuto tra l'elenco dei lakehouse e il contenuto del notebook. Selezionare cartelle diverse nella sezione Tabelle e File per aggiornare l'area del contenuto.
Operazioni su cartelle e file
Se si seleziona un file (.csv,.parquet,.txt,.jpg,.pnge così via) con un clic con il pulsante destro del mouse, è possibile usare l'API Spark o Pandas per caricare i dati. Viene generata e inserita una nuova cella di codice sotto la cella attiva.
È possibile copiare facilmente un percorso con un formato diverso dal file o cartella di selezione e usare il percorso corrispondente nel codice.
Risorse del notebook
L'esploratore delle risorse del notebook offre un file system di tipo Unix che consente di gestire cartelle e file. Offre uno spazio del file system scrivibile in cui è possibile archiviare file di piccole dimensioni, ad esempio moduli di codice, modelli semantici e immagini. È possibile accedervi facilmente con il codice nel notebook come se si stesse lavorando con il file system locale.
Nota
- Le risorse di archiviazione massime per la cartella predefinita e la cartella dell'ambiente sono 500 MB, con dimensioni di un singolo file fino a 100 MB. Entrambi consentono fino a 100 istanze di file/cartelle in totale.
- Quando si usa
notebookutils.notebook.run(), usare il comandonotebookutils.nbResPathper accedere alla risorsa del notebook di destinazione. Il percorso relativo builtin/ punterà sempre alla cartella incorporata del notebook radice.
Nota
I file nella cartella Resources (sia predefiniti che nell'ambiente) e nelle librerie installati tramite comandi inline (ad esempio %pip install o install.packages()) hanno come ambito la sessione del notebook corrente. Non sono influenzati dalla pubblicazione dell'ambiente né in modalità rapida né in modalità completa.
Cartella delle risorse integrate
La cartella delle risorse predefinite è una cartella definita dal sistema univoca per ogni notebook. È consigliabile usare la cartella di risorse predefinita per storage tutti i dati usati nel notebook corrente. Ecco le funzionalità principali per le risorse del notebook.
- È possibile usare operazioni comuni, ad esempio creazione/eliminazione, caricamento/download, trascinamento/rilascio, ridenominazione, duplicazione e ricerca nell'interfaccia utente.
- È possibile usare percorsi relativi come
builtin/YourData.txtper un'esplorazione rapida. Il metodonotebookutils.nbResPathconsente di comporre il percorso completo. - È possibile spostare facilmente i dati convalidati in un lakehouse tramite l'opzione Scrivi nel lakehouse. Fabric incorpora frammenti di codice avanzati per i tipi di file comuni per iniziare rapidamente.
- Anche queste risorse sono disponibili per l'uso nel caso di esecuzione del notebook di riferimento tramite
notebookutils.notebook.run().
Cartella delle risorse dell'ambiente
Environment Resources Folder è un repository condiviso progettato per semplificare la collaborazione tra più notebook.
È possibile trovare la scheda Risorse all'interno dell'ambiente e disporre delle operazioni complete per gestire i file di risorse qui. Questi file possono essere condivisi tra più notebook dopo che il notebook è collegato all'ambiente corrente.
Nella pagina Notebook è possibile trovare facilmente una seconda cartella radice in Risorse ereditate dall'ambiente collegato.
È anche possibile operare sui file o sulle cartelle stesse con la cartella Risorse predefinite.
Il percorso delle risorse per l'ambiente viene montato automaticamente a un cluster di notebook. È possibile usare il percorso relativo /env per accedere alle risorse dell'ambiente.
Gli ambienti Fabric supportano due modalità di pubblicazione della libreria che influiscono su come le librerie vengono recapitate alle sessioni del notebook.
- La modalità rapida pubblica in circa 5 secondi e installa le librerie all'avvio della sessione del notebook. La modalità rapida può eseguire l'override delle versioni della libreria pubblicate tramite la modalità completa, ma solo per la sessione corrente.
- La modalità completa crea uno snapshot della libreria stabile e riproducibile. La pubblicazione richiede in genere da 3 a 6 minuti e l'avvio della sessione aggiunge da 1 a 3 minuti per la distribuzione delle dipendenze. L'uso della modalità completa con un pool live personalizzato può riportare i tempi di avvio della sessione a circa 5 secondi mantenendo lo snapshot stabile.
Per informazioni dettagliate su ogni modalità, vedere Gestire le librerie in ambienti Fabric.
Utilizzare librerie ambientali nei notebook
Scegliere una modalità di pubblicazione della libreria in base al flusso di lavoro:
- Modalità rapida per lo sviluppo iterativo: usare la modalità rapida quando si sta sperimentando attivamente nei notebook e è necessaria un'iterazione rapida della libreria. Le librerie vengono installate all'inizio della sessione con un tempo di pubblicazione minimo.
- Modalità completa per la riproducibilità: usare la modalità completa quando sono necessarie versioni coerenti della libreria tra collaboratori, esecuzioni pianificate o processi di pipeline. Lo snapshot garantisce che ogni sessione inizi con le stesse dipendenze.
- Modalità completa con un pool live personalizzato per sessioni veloci e stabili: quando l'avvio rapido della sessione e la riproducibilità sono importanti, configurare la modalità completa con un pool live personalizzato. Questa combinazione consente di ottenere circa 5 secondi di avvio della sessione mantenendo lo snapshot della libreria stabile.
Nota
La lettura/scrittura con un percorso relativo non funziona in una sessione ad alta concorrenza .
Editor di file
L'editor di file consente di visualizzare e modificare i file direttamente all'interno della cartella delle risorse del notebook e della cartella delle risorse dell'ambiente nel notebook. I tipi di file supportati includono CSV, TXT, HTML, YML, PY, SQL e altro ancora. Con l'editor di file, è possibile access e modificare facilmente i file all'interno del notebook, supporta l'evidenziazione delle parole chiave e fornisce il servizio di linguaggio necessario quando si aprono e modificano file di codice come .py e .sql.
È possibile accedere a questa funzionalità attraverso 'Visualizza e modifica' nel menu File. Fare doppio clic sul file è un modo più rapido.
La modifica del contenuto nell'editor di file deve essere salvata manualmente facendo clic sul pulsante Salva o sui tasti di scelta rapida: CTRL+S, l'editor di file non supporta il salvataggio automatico.
modalità notebook influisce anche sull'editor di file. È possibile visualizzare solo i file, ma non modificarli se si è in modalità notebook senza l'autorizzazione di modifica.
Nota
Ecco alcune limitazioni per l'editor di file.
- Il limite di dimensioni del file è 1 MB.
- Questi tipi di file non sono supportati per la visualizzazione e la modifica: .xlsx e parquet.
Collaborare su un notebook
Il notebook Fabric è un elemento collaborativo che supporta più utenti che modificano lo stesso notebook.
Quando si apre un notebook, si passa alla modalità di modifica condivisa per impostazione predefinita e ogni modifica del notebook viene salvata automaticamente. Se i tuoi colleghi aprono lo stesso notebook contemporaneamente, puoi vedere il loro profilo, l'output dell'esecuzione, l'indicatore del cursore, l'indicatore di selezione e la traccia delle modifiche. Usando le funzionalità di collaborazione, è possibile eseguire facilmente la programmazione in coppia, il debug remoto e scenari di tutoring.
Usare Copilot nei notebook digitali
Copilot è immediatamente consapevole del contesto dell'area di lavoro, degli schemi di Lakehouse collegati, tabelle e file, la struttura del notebook e lo stato di runtime corrente. Non è necessario avviare una sessione perché Copilot inizi ad aiutarti. Copilot supporta la generazione di codice a livello di notebook, il refactoring, il riepilogo e la convalida in interi flussi di lavoro, in modo da poter lavorare tra più celle senza perdere contesto.
Informazioni dettagliate sulle prestazioni di Copilot
Copilot illustra le linee guida sulle prestazioni in base alle dimensioni dei dati, ai modelli di join e al comportamento di runtime. Ad esempio, può consigliare strategie di join efficienti, aiutare a evitare costosi rimescolamenti, proporre il refactoring in funzioni riutilizzabili ed evidenziare potenziali questioni relative alla qualità dei dati osservate durante l'esecuzione. Queste informazioni dettagliate vengono visualizzate come parte delle conversazioni Copilot e allineate al comando /optimize.
Risolvere i problemi relativi a Copilot
Quando una cella o un processo Spark ha esito negativo, sotto la cella non riuscita viene visualizzata un'opzione Fix with Copilot. Fornisce un riepilogo degli errori, l'analisi della causa radice e le correzioni consigliate. Copilot possibile applicare automaticamente le modifiche al codice con un diff di approvazione in modo da poter esaminare prima di eseguire il commit. È anche possibile usare il comando /fix in Copilot chat per eseguire la diagnostica di destinazione per una cella specifica o per l'intero notebook. Per ulteriori informazioni, vedere diagnosticare i guasti del notebook con Copilot.
Condividere un notebook
La condivisione di un notebook è un modo comodo per collaborare con i membri del team. I ruoli autorizzati dell'area di lavoro possono visualizzare o modificare/eseguire i notebook per impostazione predefinita. È possibile condividere un notebook con le autorizzazioni specificate concesse.
Selezionare Condividi sulla barra degli strumenti del notebook.
Selezionare la categoria corrispondente di persone che possono visualizzare questo notebook. È possibile scegliere le autorizzazioni Condividi, Modifica o Esegui per i destinatari.
Dopo aver selezionato Applica, è possibile inviare il notebook direttamente o copiare il collegamento per altri utenti. I destinatari possono quindi aprire il notebook con la visualizzazione corrispondente concessa dal loro livello di autorizzazione.
Per gestire ulteriormente le autorizzazioni del notebook, selezionare Elenco elementi dell'area di lavoro>Altre opzioni e quindi selezionare Gestisci autorizzazioni. Da questa schermata è possibile aggiornare l'accesso e le autorizzazioni del notebook esistente.
Aggiungere un commento a una cella di codice
L’aggiunta di commenti è un'altra funzionalità utile per gli scenari collaborativi. Attualmente, Fabric supporta l'aggiunta di commenti a livello di cella.
Selezionare il pulsante Commenti nella barra degli strumenti del notebook per aprire il riquadro Commenti.
Selezionare il codice nella cella di codice, scegliere Nuovo nel riquadro Commenti, aggiungere commenti e quindi selezionare Pubblica commento per salvare.
Se sono necessarie, trovare le opzioni Modifica commento, Risolvi thread ed Elimina thread selezionando l'opzione Altro accanto al commento.
Taggare altri utenti in un commento
Il "tagging" si riferisce alla menzione e alla notifica di un utente in un thread di commento, migliorando in modo efficiente la collaborazione sulle specifiche.
Selezionare una sezione di codice in una cella e un nuovo thread di commento.
Immettere il nome utente e scegliere quello corretto nell'elenco dei suggerimenti se si vuole menzionare qualcuno in una discussione su una determinata sezione.
Condividi le tue intuizioni e Pubblicale.
Viene attivata una notifica email e l'utente fa clic sul collegamento Apri commenti per individuare rapidamente questa cella.
Inoltre, autorizzare e configurare i permessi per gli utenti quando si taggano persone che non hanno accesso, assicurandosi che gli asset di codice siano ben gestiti.
Nota
Per un elemento di commento, l'utente con tag non riceverà più una notifica tramite posta elettronica se si aggiorna il commento entro un'ora. Ma invia una notifica tramite posta elettronica al nuovo utente con tag.
Cronologia delle versioni
Importante
Questa funzionalità si trova in Anteprima.
La cronologia delle versioni consente di gestire facilmente le modifiche del notebook in tempo reale. Supporta il rilevamento della cronologia e la gestione dei notebook con potenti funzionalità di controllo della versione predefinite, particolarmente utili per collaborare con più collaboratori nello stesso notebook.
Accedi alla versione cronologia dalla barra degli strumenti globale del notebook.
Notebook supporta due modalità per creare checkpoint.
Checkpoint manuale: è possibile creare manualmente una nuova versione per registrare i traguardi di sviluppo, offrendo flessibilità per gestire le versioni del tuo notebook.
Checkpoint di sistema: Questi checkpoint vengono creati automaticamente ogni 5 minuti in base all'intervallo di tempo di modifica del Sistema Notebook, assicurando che il lavoro venga salvato e versionato in modo coerente. È possibile trovare i record di modifica di tutti i collaboratori nella cronologia dei checkpoint di sistema.
Punti di controllo multi-origine per notebook
Fabric notebook si integrano perfettamente con Git, pipeline di distribuzione e Visual Studio Code. Ogni versione salvata viene acquisita automaticamente nella cronologia delle versioni del notebook. Le versioni possono provenire da modifiche dirette all'interno del notebook, dalle sincronizzazioni Git, dalle attività della pipeline di distribuzione o dalla pubblicazione tramite VS Code. L'origine di ogni versione è chiaramente etichettata nella cronologia delle versioni per garantire la tracciabilità completa.
È possibile fare clic su un checkpoint per aprire la visualizzazione diff , evidenzia le differenze di contenuto tra il checkpoint selezionato e la versione dinamica corrente, incluse le differenze tra il contenuto delle celle, l'output della cella e i metadati. La versione di questo checkpoint può essere gestita singolarmente nel menu 'ulteriori opzioni' .
È possibile gestire la versione dal menu a discesa del checkpoint, se si vuole mantenere una versione precedente, fare clic su Ripristina dal checkpoint e sovrascrivere il notebook corrente oppure usare Salva come copia per clonarlo in un nuovo notebook.
Nota
- Limitazione nota: quando più collaboratori stanno modificando, se uno di loro fa clic sul pulsante Ripristina e poi torna al notebook, il notebook non verrà ripristinato immediatamente dal checkpoint. Una barra dei messaggi richiede di visualizzare le modifiche. Per completare il ripristino, è necessario fare clic sul pulsante Visualizza modifiche e selezionare di mantenere la versione salvata .
- I checkpoint di sistema scadono dopo 1 un anno.
Interruttore modalità notebook
i notebook Fabric supportano quattro modalità tra cui Develop, Run only, Edit e View. Ogni modalità è allineata a un set di autorizzazioni.
Quando si condivide un notebook, si assegnano autorizzazioni agli utenti. In base a tali autorizzazioni, gli utenti possono accedere e passare tra le modalità disponibili.
- Modalità di sviluppo: richiede autorizzazioni di lettura, esecuzione e scrittura.
- Modalità di sola esecuzione: richiede autorizzazioni di lettura ed esecuzione.
- Modalità di modifica: richiede autorizzazioni di lettura e scrittura (non può essere eseguita).
- Modalità di visualizzazione: richiede autorizzazioni di lettura.
Autorizzazioni e accesso
Le autorizzazioni possono essere impostate a livello di area di lavoro o notebook in Microsoft Fabric. Determinano le modalità a cui un utente può accedere:
- Le autorizzazioni limitano il set di modalità disponibili.
- Non selezionano automaticamente una modalità per l'utente.
- Le modalità non possono concedere funzionalità oltre a quanto consentito dalle autorizzazioni consentite.