Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Questa funzionalità è in Anteprima Pubblica.
Il componente aggiuntivo Azure Databricks Excel connette l'area di lavoro Azure Databricks a Microsoft Excel, portando i dati di Lakehouse regolati direttamente nei fogli di calcolo per facilitare il passaggio dai dati alle decisioni più velocemente.
Questa pagina descrive come usare il componente aggiuntivo Azure Databricks Excel per importare e analizzare i dati da Azure Databricks in Excel. È possibile esplorare e importare tabelle Azure Databricks tramite un'interfaccia intuitiva in cui non è necessaria alcuna conoscenza di SQL. Anche se il componente aggiuntivo offre la flessibilità necessaria per eseguire query SQL personalizzate, è facoltativo.
Prerequisiti
Prima di usare il componente aggiuntivo Excel, verificare che sia set up.
Selezionare un magazzino SQL
Scegliere quale SQL Warehouse usare:
- In alto a destra del riquadro del componente aggiuntivo Azure Databricks in Excel, fare clic sul menu a discesa.
- Seleziona quale data warehouse SQL vuoi usare.
Importare dati da Azure Databricks
Importare dati da Azure Databricks in Excel selezionando una tabella, scrivendo una query SQL o importando una tabella pivot.
Annotazioni
È possibile importare viste delle metriche del catalogo Unity usando tabelle pivot, query SQL e funzioni personalizzate.
Creare tabelle pivot
Per creare una tabella pivot da tabelle e viste di Unity Catalog in Excel:
Nel riquadro Azure Databricks Excel Add-in, nella scheda Nuova importazione, selezionare Selezionare i dati come metodo di importazione.
In Catalogo selezionare la tabella da cui creare una tabella pivot e fare clic su Seleziona.
Selezionare la casella di controllo Tabella Pivot.
Configurare riga, colonna, valore e filtri in base alle esigenze.
(Facoltativo) Per visualizzare un esempio dell'importazione, fare clic su Anteprima.
(Facoltativo) Impostare un limite di righe per l'importazione.
Importare i risultati. Selezionare una delle opzioni seguenti:
- Fare clic su Salvare e importare per salvare la query per il riutilizzo nella cartella di lavoro Excel e importare i risultati.
- Fare clic sulla freccia giù e quindi su Importa risultati per importare i risultati senza salvare la query. Usare questa opzione quando si desidera continuare a modificare un'importazione.
Annotazioni
Le tabelle pivot possono essere importate solo in un nuovo foglio.
Quando si lavora con le metriche del catalogo Unity nelle tabelle pivot, è possibile che venga visualizzato Sum(measure) nei risultati. Questo comportamento è previsto e non si verifica alcuna aggregazione aggiuntiva. Excel richiede che i valori abbiano una funzione di aggregazione, ma poiché i dati contengono valori univoci, non si verifica alcuna aggregazione.
Selezionare le tabelle
I dati sono importati come oggetto Excel table. È possibile spostare la tabella o rinominare il foglio e il componente aggiuntivo Excel aggiorna i dati nella nuova posizione.
Per importare dati da una tabella Azure Databricks, eseguire le operazioni seguenti:
Nel riquadro Azure Databricks Excel Add-in, nella scheda Nuova importazione, selezionare Selezionare i dati come metodo di importazione.
Scegliere una tabella da importare da Esplora cataloghi. È possibile filtrare il catalogo in base al proprietario, allo stato della certificazione e ad altre proprietà usando
Fare clic su Seleziona.
In Colonne fare clic sulla freccia giù e deselezionare le colonne che non si desidera importare o lasciare selezionate tutte le colonne per importare l'intera tabella.
(Facoltativo) Per impostare i filtri, fare clic + su Accanto a Filtri, selezionare la colonna a cui applicare un filtro e quindi immettere la condizione di filtro. Per un elenco dei filtri disponibili, vedere Filtri supportati.
Per i filtri che richiedono un valore, è possibile eseguire una delle operazioni seguenti:
- Immettere il valore.
- Per generare un elenco di un massimo di 75 valori di filtro distinti che è possibile usare, fare clic su Valori e quindi su Recupera valori di filtro. Fare clic sulla freccia giù e selezionare uno o più valori dall'elenco.
- Per usare un riferimento a una cella, fare clic su Celle, selezionare una cella o un intervallo di celle, quindi fare clic sul pulsante del cursore.
Annotazioni
I valori di filtro non possono contenere una virgola. Per filtrare i valori contenenti virgole, usare invece il metodo write SQL import
(Facoltativo) Per visualizzare un esempio dell'importazione, fare clic su Anteprima.
(Facoltativo) È possibile impostare un limite di righe per limitare il numero di righe importate.
(Facoltativo) Per identificare facilmente i dati importati, è possibile immettere un nome di importazione.
In Destinazione output scegliere di importare i dati in un nuovo foglio o nel foglio corrente. Se si importa nel foglio corrente, i dati iniziano dal riferimento alla cella immessa (per impostazione predefinita A1).
Importare i risultati. Selezionare una delle opzioni seguenti:
- Fare clic su Salvare e importare per salvare la query per il riutilizzo nella cartella di lavoro Excel e importare i risultati.
- Fare clic sulla freccia giù e quindi su Importa risultati per importare i risultati senza salvare la query. Usare questa opzione quando si desidera continuare a modificare un'importazione.
Filtri supportati
Quando si importano dati selezionando una tabella, è possibile applicare filtri per restringere i risultati. La tabella seguente descrive ogni filtro disponibile e il relativo input previsto.
| Filter | Input previsto | Descrizione |
|---|---|---|
IS NULL |
Nessuno | Trova le righe in cui il valore della colonna è Null. |
IS NOT NULL |
Nessuno | Trova le righe in cui il valore della colonna non è Null. |
EQUALS |
Un numero o una stringa di testo | Trova le righe in cui il valore della colonna corrisponde esattamente al valore specificato. |
NOT EQUALS |
Un numero o una stringa di testo | Trova le righe in cui il valore della colonna non corrisponde al valore specificato. |
IN |
Uno o più numeri o stringhe di testo, separati da virgole | Trova le righe in cui il valore della colonna corrisponde a uno qualsiasi dei valori specificati. |
NOT IN |
Uno o più numeri o stringhe di testo, separati da virgole | Trova le righe in cui il valore della colonna non corrisponde ad alcuno dei valori specificati. |
LIKE |
Un modello che utilizza % (qualsiasi carattere) e _ (carattere singolo) come caratteri jolly.%smith corrisponde a qualsiasi valore che termina con "smith".t_p corrisponde a valori come "tap", "tip" o "top". |
Trova le righe in cui il valore della colonna corrisponde al criterio. Distinzione tra maiuscole e minuscole. |
NOT LIKE |
Un modello che utilizza % (qualsiasi carattere) e _ (carattere singolo) come caratteri jolly.%test% esclude i valori contenenti "test"._at esclude valori come "bat", "cat" o "hat". |
Trova le righe in cui il valore della colonna non corrisponde al criterio. Distinzione tra maiuscole e minuscole. |
ILIKE |
Un modello che utilizza % (qualsiasi carattere) e _ (carattere singolo) come caratteri jolly.%Smith corrisponde a valori come "smith", "Smith" o "SMITH"._ob corrisponde a "Bob", "rob" o "Rob". |
Trova le righe in cui il valore della colonna corrisponde al criterio. Senza distinzione tra maiuscole e minuscole. |
STARTS WITH |
Una stringa di testo | Trova le righe in cui il valore della colonna inizia con il testo specificato. |
ENDS WITH |
Una stringa di testo | Trova le righe in cui il valore della colonna termina con il testo specificato. |
CONTAINS |
Una stringa di testo | Trova le righe in cui il valore della colonna contiene il testo specificato in qualsiasi punto della stringa. |
Scrivere query SQL
Il metodo di importazione Write SQL supporta le funzioni SQL e le stored procedure.
Per eseguire query SQL personalizzate sull'area di lavoro Azure Databricks, eseguire le operazioni seguenti:
Nel riquadro del componente aggiuntivo Azure Databricks Excel, nella scheda Nuova importazione, selezionare Scrivi SQL come metodo di Importazione.
Immettere un nome per la query per identificarla in un secondo momento.
Scrivere una nuova query o usare una query esistente dall'area di lavoro Azure Databricks.
Scrivere la query SQL nell'editor. È possibile eseguire query su qualsiasi tabella nel catalogo unity a cui si dispone delle autorizzazioni per l'accesso.
- Fare clic
Esplora cataloghi per visualizzare gli schemi e le tabelle.
- Fare clic
Per usare una query dall'area di lavoro Azure Databricks o da una query esistente in Excel, fare clic su
la cartella. Se si usa una query esistente dall'area di lavoro Azure Databricks, le modifiche apportate in Excel non vengono riflesse sulle Azure Databricks.
Annotazioni
Le query devono essere salvate in modo esplicito in Azure Databricks usando il pulsante Save nell'editor di query prima che vengano visualizzate in Excel.
(Facoltativo) Per aggiungere parametri di query, fare clic su +Aggiungi accanto a Parametri. Fare clic sul parametro e immettere Il nome del parametro e il valore del parametro.
- Per il valore del parametro, è possibile immettere un valore specifico oppure fare clic sul pulsante casella e freccia per specificare un riferimento di cella. Selezionare una cella o un intervallo di celle e fare clic sulla freccia per riempire automaticamente il valore del parametro.
In Destinazione output scegliere di importare i dati in un nuovo foglio o nel foglio corrente. Se si importa nel foglio corrente, i dati iniziano dal riferimento alla cella immessa (per impostazione predefinita A1).
Per visualizzare in anteprima i risultati della query, fare clic su Esegui.
Importare i risultati. Selezionare una delle opzioni seguenti:
- Fare clic su Salvare e importare per salvare la query per il riutilizzo nella cartella di lavoro Excel e importare i risultati.
- Fare clic sulla freccia giù e quindi su Importa risultati per importare i risultati senza salvare la query. Usare questa opzione quando si desidera continuare a modificare un'importazione.
È anche possibile usare funzioni personalizzate per aggiungere parametri di query. Vedi Scrivere SQL.
Usare funzioni personalizzate in Excel
Il componente aggiuntivo Excel fornisce funzioni personalizzate che è possibile usare nelle formule Excel per importare dati da Azure Databricks.
Selezionare una tabella
La DATABRICKS.Table funzione importa i dati da una tabella di Unity Catalog.
Sintassi:
=DATABRICKS.Table(catalog_name.schema_name.table_name, [column1, ...], [limit])
Parametri:
-
catalog_name.schema_name.table_name(obbligatorio): nome completo della tabella. -
columns(facoltativo): matrice di nomi di colonna da importare. Omettere questo parametro per importare tutte le colonne. -
limit(facoltativo): numero massimo di righe da importare. Omettere questo parametro per importare tutte le righe, fino al limite di 10 MB.
Esempio:
=DATABRICKS.Table("main.default.customers", {"customer_id", "customer_name"}, 100)
Questa formula importa le customer_id colonne e customer_name dalla main.default.customers tabella, limitate a 100 righe.
Scrivere SQL
La DATABRICKS.SQL funzione esegue una query SQL che usa parametri di query e restituisce i risultati.
Sintassi:
Specificare i parametri usando i valori.
=DATABRICKS.SQL("query_text", {parameter1_name, parameter1_value; ...})
Specificare i parametri usando un intervallo di celle. I parametri nome e valore devono essere definiti nelle celle che si trovano nella stessa riga.
=DATABRICKS.SQL("query_text", {param_name_cell: param_value_cell; ...})
Parametri:
-
query_text(obbligatorio): la query SQL da eseguire. -
parameters(obbligatorio): una mappatura dei valori dei parametri da sostituire nella query.
Esempio:
=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE longitude > :long_param AND latitude > :lat_param LIMIT 10", {"long_param",20; "lat_param",10})
=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE city = :city", M4:N4)
Questa formula esegue una query che filtra i dati di vendita in base a longitude e latitude usando i valori dei parametri forniti.
Gestire le interrogazioni
Gestire le importazioni esistenti dalla pagina Importazioni.
Modificare un'importazione esistente
Per modificare un'importazione esistente:
- Nel riquadro del componente aggiuntivo Azure Databricks in Excel, fare clic sulla scheda Imports.
- Trovare l'importazione da modificare.
- Fare clic sul menu a tre punti accanto all'importazione.
- Fare clic su Modifica per modificare l'importazione.
Aggiornare i dati
Il componente aggiuntivo Excel non aggiorna automaticamente i dati importati. Per aggiornare i dati con i valori più recenti di Azure Databricks:
- Per aggiornare una singola importazione, eseguire le operazioni seguenti:
- Nel riquadro del componente aggiuntivo Azure Databricks in Excel, fare clic sulla scheda Imports.
- Fare clic
Aggiornare accanto all'importazione che si desidera aggiornare.
- Per aggiornare tutte le importazioni, eseguire le operazioni seguenti:
- Fare clic su Refresh All nel riquadro del componente aggiuntivo Azure Databricks.
Il componente aggiuntivo esegue di nuovo la query o la selezione della tabella originale e aggiorna il foglio di lavoro con i dati aggiornati.
Importante
Quando si aggiornano i dati, il componente aggiuntivo Excel cancella tutti i dati esistenti nella tabella specificata e ricarica i dati più recenti da Azure Databricks. Tutte le colonne personalizzate aggiunte alla tabella vengono eliminate durante il processo di aggiornamento.
Implicazioni per la condivisione
Quando si condivide una cartella di lavoro di Excel che contiene Azure Databricks dati, considerare le implicazioni seguenti per l'accesso ai dati e la sicurezza:
Visibilità dei dati importati
Quando un destinatario aggiorna un'importazione, il componente aggiuntivo usa le autorizzazioni del catalogo Unity del destinatario. Se non hanno accesso ai dati sottostanti, l'aggiornamento non riesce.
Per le cartelle di lavoro in cui la privacy dei dati è un problema, è possibile usare la soluzione alternativa seguente:
- Creare una cartella di lavoro con tutte le formule e le importazioni necessarie.
- Eliminare i dati importati dal foglio.
- Condividere la cartella di lavoro con il destinatario.
- Chiedere al destinatario di aggiornare i dati.
Il destinatario vede solo i dati a cui ha accesso in base alle autorizzazioni del catalogo Unity.
Accesso alle aree di lavoro e agli asset di dati
- Gli utenti senza accesso agli oggetti del catalogo Unity a cui si fa riferimento nella cartella di lavoro non possono aggiornare i dati. Per aggiornare i dati, gli utenti devono disporre delle autorizzazioni di lettura per le tabelle e le viste sottostanti in Unity Catalog.
- Gli utenti devono avere accesso alla tabella sottostante in Azure Databricks per modificare le importazioni esistenti.
Visibilità delle query
Gli utenti con accesso di modifica alla cartella di lavoro possono visualizzare le query usate per generare i dati tramite il componente aggiuntivo Azure Databricks, anche se non hanno accesso ai dati sottostanti in Unity Catalog.
Limitazioni
- Funzioni personalizzate: per le funzioni personalizzate, i risultati delle query sono limitati a 25 MiB a causa delle limitazioni dell'API di esecuzione SQL.
- Caricamento dati: il caricamento dei dati potrebbe non riuscire se una cella della cartella di lavoro è in modalità di modifica.
- Excel Limite di righe desktop: Excel Desktop supporta un massimo di 1.048.576 righe per foglio.
- Excel for the web limite di dimensioni del file: Excel for the web supporta una dimensione massima del file della cartella di lavoro di circa 25 MB per la visualizzazione e la modifica.