Condividi tramite


Usare i tag per attribuire e tenere traccia dell'utilizzo

Questo articolo illustra come usare i tag per attribuire l'utilizzo di calcolo a aree di lavoro, team, progetti o utenti specifici per supportare il rilevamento dei costi e il budget.

Esistono due tipi di tag:

  • Tag predefiniti: applicati automaticamente da Databricks alle risorse distribuite nel cloud. Questi forniscono metadati di base, ad esempio fornitore, ID cluster e creator.
  • Tag personalizzati: tag definiti dall'utente che è possibile aggiungere alle risorse di calcolo e ai carichi di lavoro serverless. Questi consentono il rilevamento granulare, la creazione di report e il budget.

Avviso

I dati dei tag vengono archiviati come testo normale e possono essere replicati a livello globale. Non usare nomi, valori o descrittori di tag che potrebbero compromettere la sicurezza delle risorse. Ad esempio, non usare nomi di tag, valori o descrittori che contengono informazioni personali o riservate.

Tag predefiniti

Azure Databricks aggiunge automaticamente tag predefiniti alle risorse di calcolo distribuite nell'account cloud. Questi tag assegnano l'utilizzo a Databricks e forniscono informazioni di base sulla risorsa, ad esempio il nome, l'ID e l'autore.

I tag predefiniti vengono propagati automaticamente ai report dettagliati di analisi cost a cui è possibile accedere nel portale di Azure.

Di seguito è riportato un report dei dettagli della fattura di analisi dei costi nel portale di Azure che illustra in dettaglio il costo in base al tag clusterid in un periodo di un mese:

Analisi dei costi per ID cluster

Chiavi e valori di tag predefiniti

Azure Databricks aggiunge i tag predefiniti seguenti alle risorse di calcolo:

Chiave del tag Valore
Vendor Valore costante: Databricks
ClusterId L'ID interno del cluster di Azure Databricks
ClusterName Nome del cluster
Creator Nome utente (indirizzo di posta elettronica) dell'utente che ha creato il cluster
RunName Nome processo (propaga solo nell'ambiente di calcolo dei processi). Se usi il Jobs API 2.0, equivale a run_name. Nell'API Processi 2.1, esso è il task_key.
JobId ID lavoro (propagazione solo nei calcoli dei lavori)

Il calcolo usato dalla profilatura dei dati include questi tag aggiuntivi:

Chiave del tag Valore
LakehouseMonitoring vero
LakehouseMonitoringTableId ID della tabella monitorata
LakehouseMonitoringWorkspaceId ID dell'area di lavoro in cui è stato creato il monitoraggio
LakehouseMonitoringMetastoreId ID del metastore in cui esiste la tabella monitorata

Azure Databricks aggiunge i tag predefiniti seguenti ai pool e alle risorse di calcolo create dai pool.

Chiave del tag Valore
Vendor Valore costante: Databricks
DatabricksInstancePoolCreatorId Azure Databricks ID interno dell'utente che ha creato il pool
DatabricksInstancePoolId ID interno del pool di Azure Databricks

Tag personalizzati

I tag personalizzati consentono di attribuire l'utilizzo di calcolo a team, progetti o centri di costo specifici con una maggiore granularità rispetto ai tag predefiniti. Questi tag vengono applicati dagli utenti o dagli amministratori e propagati sia ai log di utilizzo dell'account che alle risorse cloud applicabili. Questi tag vengono usati anche per creare e monitorare i budget nell'account Azure Databricks.

Risorse supportate per i tag personalizzati

Oggetto Interfaccia di assegnazione di tag Interfaccia di assegnazione di tag (API)
Area di lavoro portale di Azure API di risorse di Azure
Piscina Interfaccia utente dei pool nell'area di lavoro Azure Databricks API del pool di istanze
Calcolo universale e computazione degli incarichi Interfaccia utente di calcolo nell'area di lavoro Azure Databricks API dei cluster
Magazzino SQL Interfaccia utente di SQL Warehouse nell'area di lavoro Azure Databricks Warehouses API
Istanza del database Interfaccia utente dell'istanza del database nell'area di lavoro Azure Databricks API delle istanze di database
Progetto di scalabilità automatica di Lakebase App Lakebase nell'area di lavoro Azure Databricks Postgres API

Avviso

Non assegnare un tag personalizzato con la chiave Name a un cluster. Ogni cluster ha un tag Name il cui valore è impostato da Azure Databricks. Se si modifica il valore associato alla chiave Name, il cluster non può più essere rilevato da Azure Databricks. Di conseguenza, il cluster potrebbe non essere terminato dopo essere diventato inattivo e continuerà a comportare costi di utilizzo.

Contrassegnare i carichi di lavoro di calcolo serverless

Importante

Questa funzionalità è in Public Preview.

Per attribuire l'utilizzo del calcolo serverless a utenti, gruppi o progetti, è possibile usare criteri di utilizzo serverless. Quando a un utente viene assegnata una politica di utilizzo serverless, il loro utilizzo serverless viene automaticamente contrassegnato con i tag personalizzati della loro politica. I criteri di utilizzo serverless possono essere applicati a notebook serverless, processi, pipeline e endpoint di gestione dei modelli.

Annotazioni

L'utilizzo delle risorse di calcolo serverless viene registrato nella tabella del sistema di utilizzo fatturabile dell'account. I report di utilizzo DBU legacy non includono l’utilizzo serverless o i tag dei criteri di utilizzo serverless.

Vedere Utilizzo degli attributi con criteri di utilizzo serverless.

Propagazione tag

I tag dell'area di lavoro, del pool e del cluster vengono aggregati da Azure Databricks e propagati su macchine virtuali Azure per il reporting di analisi dei costi. Ma i tag del pool e del cluster vengono propagati in modo diverso l'uno dall'altro.

I tag dell'area di lavoro e del pool vengono aggregati e assegnati come tag di risorsa delle macchine virtuali Azure che ospitano i pool.

I tag dell'area di lavoro e del cluster vengono aggregati e assegnati come tag delle risorse delle macchine virtuali Azure che ospitano i cluster.

Quando i cluster vengono creati dai pool, solo i tag dell'area di lavoro e i tag del pool vengono propagati alle macchine virtuali. Le etichette del cluster non vengono propagate per preservare le prestazioni di avvio del pool cluster.

Risoluzione dei conflitti di tag

Quando un tag personalizzato (area di lavoro, cluster o tag pool) ha lo stesso nome di chiave di un tag predefinito Azure Databricks, il tag personalizzato viene automaticamente preceduto da x_ durante la propagazione. Il tag Azure Databricks predefinito mantiene il nome della chiave originale.

Ad esempio, Azure Databricks applica un tag cluster predefinito vendor = Databricks a tutti i cluster. Se si aggiunge un tag dell'area di lavoro personalizzato , questo è in conflitto con il tag /> predefinito x_vendor = Azure Databricks, mentre il tag Azure Databricks predefinito rimane come vendor = Databricks.

Avviso

I tag personalizzati in conflitto aggiunti tramite i criteri di calcolo non vengono risolti, causando il fallimento del cluster o del pool con un errore di configurazioni non valide. Assicurarsi che i criteri di calcolo non aggiungono nomi di tag in conflitto.

Applicazione dei tag

Per applicare l'uso di tag personalizzati specifici, è possibile usare i criteri di calcolo. Consultare applicazione dei tag personalizzati. Per applicare tag personalizzati nei carichi di lavoro di calcolo serverless, usare i criteri di utilizzo serverless.

Limiti

  • La propagazione dei tag dell'area di lavoro personalizzati in Azure Databricks dopo qualsiasi modifica può richiedere fino a un'ora.
  • Non è possibile assegnare più di 50 tag a una risorsa Azure. Se il numero complessivo di tag aggregati supera questo limite, i tag con prefisso x_vengono valutati in ordine alfabetico e quelli che superano il limite vengono ignorati. Se tutti i tag con prefisso x_vengono ignorati e il conteggio non supera il limite, i tag rimanenti vengono valutati in ordine alfabetico e quelli che superano il limite vengono ignorati.
  • I valori e le chiavi dei tag possono contenere solo lettere, spazi, numeri o caratteri +, -, =, ., _, :, /, @. I tag contenenti altri caratteri non sono validi. Queste restrizioni relative ai caratteri vengono impostate da Azure Resource Manager.
  • Se si modificano i nomi o i valori delle chiavi dei tag, queste modifiche si applicano solo dopo il riavvio del cluster o l'espansione del pool.
  • Se i tag personalizzati del cluster sono in conflitto con i tag personalizzati di un pool, il cluster non può essere creato.
  • I tag dell'area di lavoro appena aggiunti, modificati o eliminati non vengono propagati automaticamente alle risorse di calcolo esistenti. Per ottenere nuovi tag da propagare, aprire la pagina dei dettagli della risorsa di calcolo, fare clic su Modifica e quindi confermare e riavviare.