Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Usa a tarefa Python script para executar um ficheiro Python.
Configurar uma tarefa de script Python
Antes de começar, deve carregar o seu script em Python para um local acessível ao utilizador que está a configurar o trabalho. O Databricks recomenda usar ficheiros workspace para scripts Python. Consulte O que são arquivos de espaço de trabalho?.
Note
A interface de trabalhos exibe opções dinamicamente com base em outras definições.
A Databricks recomenda não armazenar código ou dados na raiz ou em montagens do DBFS. Em vez disso, pode migrar scripts Python para ficheiros ou volumes de workspace ou usar URIs para aceder ao armazenamento de objetos na cloud.
Para iniciar o fluxo para configurar uma tarefa Python script:
- Vá para o separador Tarefas na IU de Trabalhos.
- Clique em Adicionar tarefa.
- Insira um nome no campo Nome da tarefa .
- No menu suspenso Type, selecione
Python script.
Configurar a origem
No menu suspenso Source, selecione uma localização para o script de Python usando uma das seguintes opções.
Workspace
Use Workspace para configurar um script Python armazenado usando ficheiros workspace.
- Clique no campo Caminho . Aparece o diálogo Select Python File.
- Navegue até ao script Python, clique para destacar o ficheiro e clique em Confirmar.
Note
Pode usar esta opção para configurar uma tarefa num script Python armazenado numa pasta Databricks Git. O Databricks recomenda o uso da opção de provedor Git e um repositório Git remoto para versionar ativos com trabalhos agendados.
DBFS/ADLS
Use DBFS/ADLS para configurar um script Python armazenado num volume, numa localização de armazenamento de objetos na nuvem ou na raiz do DBFS.
O Databricks recomenda armazenar scripts Python em volumes do Unity Catalog ou armazenamento de objetos na cloud.
No campo Path, introduza o URI do seu script de Python. Por exemplo, dbfs:/path/to/script.py ou abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py.
Fornecedor Git
Use Git provider para configurar um script Python armazenado num repositório Git remoto.
As opções exibidas pela interface do usuário dependem se você já configurou ou não um provedor Git em outro lugar. Apenas um repositório Git remoto pode ser usado para todas as tarefas em um trabalho. Veja Usar o Git com Lakeflow Jobs.
O campo Caminho aparece depois de configurar uma referência Git.
Introduza o caminho relativo do seu script de Python, como etl/bronze/ingest.py.
Important
Ao inserir o caminho relativo, não comece com / ou ./. Por exemplo, se o caminho absoluto para o código Python que pretende aceder for /etl/bronze/ingest.py, introduza etl/bronze/ingest.py no campo Path.
Configurar bibliotecas de computação e dependentes
- Use Compute para selecionar ou configurar um cluster que ofereça suporte à lógica no seu script.
- Se utilizar a computação
Serverless, use o campo Ambiente e Bibliotecas para selecionar, editar ou adicionar um novo ambiente. Consulte Configurar o ambiente sem servidor. - Para todas as outras configurações de computação, clique em + Adicionar em Bibliotecas dependentes. A caixa de diálogo Adicionar biblioteca dependente é exibida.
- Você pode selecionar uma biblioteca existente ou carregar uma nova biblioteca.
- Você só pode usar bibliotecas armazenadas em um local suportado por suas configurações de computação. Veja suporte para a biblioteca Python.
- Cada fonte de biblioteca tem um fluxo diferente para selecionar ou carregar uma biblioteca. Consulte Instalar bibliotecas.
Finalizar a configuração do trabalho
- (Opcional) Configure Parameters como uma lista de strings passadas como argumentos CLI para o script Python. Consulte Configurar parâmetros de tarefa.
- Clique em Salvar tarefa.