Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Observação
Este artigo aborda Databricks Connect para Databricks Runtime 13.3 LTS e posteriores.
Este artigo descreve como usar Databricks Utilities com o Databricks Connect for Python. O Databricks Connect permite-lhe ligar IDEs populares, servidores de cadernos e aplicações personalizadas a clusters do Azure Databricks. Consulte Databricks Connect.
Antes de começar a usar o Databricks Connect, você deve configurar o cliente Databricks Connect.
Para obter a versão Scala deste artigo, consulte Databricks Utilities with Databricks Connect for Scala.
Utilidades Databricks Disponíveis
Você usa o Databricks Connect para acessar os utilitários Databricks da seguinte maneira:
- Use a variável
WorkspaceClientda classedbutilspara aceder aos Databricks Utilities. A classeWorkspaceClientpertence ao SDK Databricks para Python e está incluída no Databricks Connect. - Use
dbutils.fspara aceder ao utilitário Databricks Utilities fs. - Use
dbutils.secretspara aceder ao utilitário de segredos dos Utilitários Databricks .
Nenhuma funcionalidade do Databricks Utilities além dos utilitários anteriores está disponível a partir de dbutils.
Dica
Também pode usar o SDK Databricks para Python incluído para aceder a qualquer API Databricks REST disponível, não apenas às APIs Databricks Utilities anteriores. Consulte databricks-sdk no PyPI.
Iniciar o WorkspaceClient
Para inicializar WorkspaceClient, você deve fornecer informações suficientes para autenticar um SDK do Databricks com o espaço de trabalho. Por exemplo, você pode:
Codifique diretamente a URL do espaço de trabalho e o token de acesso no seu código e, em seguida, inicialize
WorkspaceClientda seguinte maneira. Embora essa opção seja suportada, o Databricks não recomenda essa opção, pois ela pode expor informações confidenciais, como tokens de acesso, se o seu código for verificado no controle de versão ou compartilhado de outra forma:from databricks.sdk import WorkspaceClient w = WorkspaceClient(host = f"https://{retrieve_workspace_instance_name()}", token = retrieve_token())Crie ou especifique um perfil de configuração que contenha os campos
hostetokene, em seguida, inicialize oWorkspaceClientda seguinte maneira:from databricks.sdk import WorkspaceClient w = WorkspaceClient(profile = "<profile-name>")Defina as variáveis de ambiente
DATABRICKS_HOSTeDATABRICKS_TOKENda mesma forma que você as definiu para o Databricks Connect e, em seguida, inicializeWorkspaceClientda seguinte maneira:from databricks.sdk import WorkspaceClient w = WorkspaceClient()
O SDK Databricks para Python não reconhece a variável de ambiente SPARK_REMOTE para o Databricks Connect.
Para opções adicionais de autenticação do Azure Databricks para o SDK Databricks para Python, bem como como inicializar AccountClient dentro dos SDKs Databricks para acederem às APIs REST disponíveis a nível da conta em vez de a nível do espaço de trabalho, consulte databricks-sdk no PyPI.
Exemplo: Criar um ficheiro num volume
O exemplo seguinte mostra como usar o SDK Databricks para Python para automatizar as Utilidades Databricks. Este exemplo cria um arquivo nomeado zzz_hello.txt no caminho de um volume do Unity Catalog dentro do espaço de trabalho, lê os dados do arquivo e exclui o arquivo. Este exemplo pressupõe que as variáveis de ambiente DATABRICKS_HOST e DATABRICKS_TOKEN já foram definidas:
from databricks.sdk import WorkspaceClient
w = WorkspaceClient()
file_path = "/Volumes/main/default/my-volume/zzz_hello.txt"
file_data = "Hello, Databricks!"
fs = w.dbutils.fs
fs.put(
file = file_path,
contents = file_data,
overwrite = True
)
print(fs.head(file_path))
fs.rm(file_path)
Ver também Interação com dbutils no SDK Databricks para documentação Python.