Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Use a tarefa de script Python para executar um arquivo Python.
Configurar uma tarefa de script Python
Antes de começar, você deve carregar seu script Python para um local acessível ao usuário que está configurando o trabalho. O Databricks recomenda o uso de arquivos de espaço de trabalho para scripts Python. Consulte O que são arquivos de espaço de trabalho?.
Note
A interface de trabalhos exibe opções dinamicamente com base em outras definições.
A Databricks recomenda não armazenar código ou dados na raiz ou em montagens do DBFS. Em vez disso, você pode migrar scripts Python para arquivos ou volumes de espaço de trabalho ou usar URIs para acessar o armazenamento de objetos na nuvem.
Para iniciar o fluxo para configurar uma Python script tarefa:
- Vá para o separador Tarefas na IU de Trabalhos.
- Clique em Adicionar tarefa.
- Insira um nome no campo Nome da tarefa .
- No menu suspenso do Tipo , selecione
Python script.
Configurar a origem
No menu drop-down Source, selecione um destino para o script Python usando uma das seguintes opções.
Workspace
Use Workspace para configurar um script Python armazenado usando arquivos de espaço de trabalho.
- Clique no campo Caminho . A caixa de diálogo Select Python File é exibida.
- Navegue até o script Python, clique para realçar o arquivo e clique em Confirmar.
Note
Você pode usar essa opção para configurar uma tarefa em um script Python armazenado em uma pasta Databricks Git. O Databricks recomenda o uso da opção de provedor Git e um repositório Git remoto para versionar ativos com trabalhos agendados.
DBFS/ADLS
Use DBFS/ADLS para configurar um script Python armazenado em um volume, local de armazenamento de objetos na nuvem ou a raiz DBFS.
O Databricks recomenda armazenar scripts Python em volumes do Unity Catalog ou armazenamento de objetos na nuvem.
No campo Caminho, insira o URI para o script Python. Por exemplo, dbfs:/path/to/script.py ou abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py.
Provedor Git
Utilize o provedor Git para configurar um script Python armazenado num repositório Git remoto.
As opções exibidas pela interface do usuário dependem se você já configurou ou não um provedor Git em outro lugar. Apenas um repositório Git remoto pode ser usado para todas as tarefas em um trabalho. Consulte Utilizar o Git com tarefas.
O campo Caminho aparece depois de configurar uma referência Git.
Insira o caminho relativo para seu script Python, como etl/bronze/ingest.py.
Important
Ao inserir o caminho relativo, não comece com / ou ./. Por exemplo, se o caminho absoluto para o código Python que você deseja acessar for /etl/bronze/ingest.py, digite etl/bronze/ingest.py no campo Caminho .
Configurar bibliotecas de computação e dependentes
- Use Compute para selecionar ou configurar um cluster que ofereça suporte à lógica no seu script.
- Se utilizar a computação
Serverless, use o campo Ambiente e Bibliotecas para selecionar, editar ou adicionar um novo ambiente. Consulte Configurar o ambiente sem servidor. - Para todas as outras configurações de computação, clique em + Adicionar em Bibliotecas dependentes. A caixa de diálogo Adicionar biblioteca dependente é exibida.
- Você pode selecionar uma biblioteca existente ou carregar uma nova biblioteca.
- Você só pode usar bibliotecas armazenadas em um local suportado por suas configurações de computação. Consulte o suporte da biblioteca Python.
- Cada fonte de biblioteca tem um fluxo diferente para selecionar ou carregar uma biblioteca. Consulte Instalar bibliotecas.
Finalizar a configuração do trabalho
- (Opcional) Configure Parameters como uma lista de cadeias de caracteres passadas como argumentos CLI para o script Python. Consulte Configurar parâmetros de tarefa.
- Clique em Salvar tarefa.