Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
È possibile automatizzare la configurazione di Unity Catalog usando il provider Databricks Terraform. Questo articolo fornisce collegamenti alla guida alla distribuzione del catalogo Unity del provider Terraform e alla documentazione di riferimento sulle risorse, insieme ai requisiti ("Prima di iniziare") e ai suggerimenti per la convalida e la distribuzione.
Prima di iniziare
Per automatizzare la configurazione del catalogo Unity con Terraform, è necessario disporre degli elementi seguenti:
- L'account Azure Databricks deve trovarsi nel piano Premium.
- Nel tenant Azure è necessario disporre dell'autorizzazione per creare:
- Un account di archiviazione da usare con Azure Data Lake Storage. Vedere Creare un account di archiviazione da usare con Azure Data Lake Storage.
- Una nuova risorsa per ospitare un'identità gestita assegnata dal sistema. È necessario essere
ContributoroOwnerdi un gruppo di risorse appartenente a qualsiasi sottoscrizione del tenant.
Per usare il provider Databricks Terraform per configurare un metastore per Unity Catalog, l'archiviazione per il metastore, qualsiasi risorsa di archiviazione esterna e tutte le relative credenziali di accesso, è necessario disporre dei seguenti elementi:
- Un account Azure.
- Un utente amministratore a livello di account nell'account Azure.
- Nel computer di sviluppo locale è necessario disporre di:
Interfaccia a riga di comando (CLI) di Terraform. Consulta la pagina Scaricare Terraform sul sito Web di Terraform.
Il interfaccia della riga di comando di Azure, connesso tramite il comando
az logincon un utente con diritti diContributoroOwnerper la sottoscrizione. Vedere Come installare il interfaccia della riga di comando di Azure. Per accedere con un account utente o un'entità del servizio, vedere Accedere con l'interfaccia della riga di comando di Azure.Nota
Quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, è una best practice di sicurezza autenticarsi tramite il comando
az logincon un principale servizio Microsoft Entra ID. Vedere Accedere con un principal del servizio e Autenticazione con Principal del Servizio di Azure.
Per usare il provider Databricks Terraform per configurare tutti gli altri componenti dell'infrastruttura di Unity Catalog, è necessario disporre degli elementi seguenti:
- Un'area di lavoro Azure Databricks.
- Nel computer di sviluppo locale è necessario disporre di:
- Interfaccia a riga di comando (CLI) di Terraform. Consulta la pagina Scaricare Terraform sul sito Web di Terraform.
- Uno dei seguenti:
Interfaccia della riga di comando di Databricks versione 0.205 o successiva, configurata con il tuo token di accesso personale di Azure Databricks eseguendo
databricks configure --host <workspace-url> --profile <some-unique-profile-name>. Vedi Installare o aggiornare l'interfaccia a riga di comando di Databricks e Autenticazione mediante token di accesso personale (legacy).Nota
Come procedura consigliata per la sicurezza, quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, Databricks consiglia di usare token di accesso personali appartenenti alle entità servizio anziché agli utenti dell'area di lavoro. Per creare token per le entità servizio, vedere Gestire i token per un'entità servizio.
Il interfaccia della riga di comando di Azure, connesso tramite il comando
az login. Vedere Come installare il interfaccia della riga di comando di Azure. Per accedere con un account utente o un'entità servizio, vedere Accedere con l'interfaccia della riga di comando di Azure.Nota
Quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, è consigliabile eseguire l'accesso tramite il comando
az logincon un principale del servizio Microsoft Entra ID. Vedi Accedi con un principal del servizio e Autenticazione con Azure Service Principal.Le seguenti due variabili di ambiente di Azure Databricks:
-
DATABRICKS_HOST, impostato al valore dell'URL dell'istanza del tuo spazio di lavoro , per esempiohttps://dbc-1234567890123456.cloud.databricks.com -
DATABRICKS_TOKEN, impostare sul valore del token personale di accesso Azure Databricks o del token di Microsoft Entra ID (in precedenza Azure Active Directory). Vedere anche Monitorare e revocare i token di accesso personali.
Per impostare queste variabili di ambiente, vedere la documentazione del sistema operativo.
Nota
Come procedura consigliata per la sicurezza, quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, Databricks consiglia di usare token di accesso personali appartenenti alle entità servizio anziché agli utenti dell'area di lavoro. Per creare token per le entità servizio, vedere Gestire i token per un'entità servizio.
-
Guida alla distribuzione del catalogo Unity del provider Terraform e documentazione di riferimento sulle risorse
Per informazioni su come distribuire tutti i prerequisiti e abilitare Unity Catalog per un'area di lavoro, vedere Distribuzione delle risorse prerequisite e abilitazione di Unity Catalog nella documentazione del provider Databricks Terraform.
Se sono già presenti alcuni componenti dell'infrastruttura del catalogo Unity, è possibile usare Terraform per distribuire componenti aggiuntivi dell'infrastruttura del catalogo Unity in base alle esigenze. Vedere ogni sezione della guida a cui si fa riferimento nel paragrafo precedente e nella sezione Catalogo Unity della documentazione del provider Databricks Terraform.
Convalidare, pianificare, distribuire o eliminare definitivamente le risorse
- Per convalidare la sintassi delle configurazioni terraform senza distribuirle, eseguire il comando
terraform validate. - Per visualizzare le azioni eseguite da Terraform per distribuire le configurazioni, eseguire il comando
terraform plan. Questo comando non distribuisce effettivamente le configurazioni. - Per distribuire le configurazioni, eseguire il comando
terraform deploy. - Per eliminare le risorse distribuite, eseguire il comando
terraform destroy.