Partilhar via


Tutorial: Criar e implantar um pacote no espaço de trabalho

Para ajudá-lo a começar a usar o Databricks Asset Bundles no espaço de trabalho, este tutorial orienta você na criação de um pacote com um trabalho, na implantação e na execução do trabalho no pacote - tudo a partir do espaço de trabalho.

Para obter os requisitos para usar pacotes no espaço de trabalho, consulte Databricks Asset Bundles nos requisitos do espaço de trabalho.

Para obter mais informações sobre pacotes, consulte O que são Databricks Asset Bundles?.

Criar um pacote

Primeiro, crie um pacote no espaço de trabalho Databricks:

  1. Navegue até a pasta Git onde você deseja criar seu pacote.

    Sugestão

    Se você tiver aberto anteriormente a pasta Git no editor no espaço de trabalho, poderá usar o menu de contextos de criação do navegador de espaço de trabalho para navegar rapidamente até a pasta Git. Consulte Contextos de criação.

  2. Clique no botão Criar e, em seguida, clique em Pacote de ativos. Como alternativa, clique com o botão direito do mouse na pasta Git ou no kebab associado na árvore do espaço de trabalho e clique em Criar>pacote de ativos:

    Criar um pacote de ativos

  3. Na caixa de diálogo Criar um pacote de ativos , dê um nome ao pacote de ativos, como totally-awesome-bundle. O nome do pacote só pode conter letras, números, traços e sublinhados. Selecione Projeto vazio e clique em Criar e implantar .

    Caixa de diálogo Criar novo pacote de ativos

Isso cria um pacote inicial na pasta Git, que inclui um arquivo de .gitignore configuração do Git e o arquivo Databricks Asset Bundles databricks.yml necessário. O databricks.yml arquivo contém a configuração principal para o pacote. Para obter detalhes, consulte Configuração do Databricks Asset Bundle.

Novo pacote de ativos

Adicionar um bloco de notas

Em seguida, adicione um portátil ao seu pacote. O bloco de anotações no exemplo a seguir imprime "Hello World!".

  1. Clique na telha do projeto de pacote Adicionar notebook. Como alternativa, clique no kebab para o pacote no sumário e, em seguida, clique em Criar>Bloco de Anotações.

  2. Renomeie o bloco de anotações para helloworld.

  3. Defina o idioma do bloco de anotações como Python e cole o seguinte na célula do bloco de anotações:

    print("Hello World!")
    

Definir um trabalho

Agora defina uma tarefa que execute o notebook.

  1. Clique no ícone de implantação do pacote para alternar para o painel Implantações .

    Ícone do painel Implementações

  2. Na seção Recursos do pacote , clique em Adicionar e, em seguida, em Nova definição de trabalho.

    Criar definição de trabalho

  3. Digite run-notebook no campo Nome do trabalho da caixa de diálogo Adicionar trabalho ao pacote existente . Clique em Adicionar e implantar.

  4. Uma caixa de diálogo de confirmação Implantação para ambiente de desenvolvimento é exibida, contendo informações sobre o recurso de tarefa que será criado no ambiente de trabalho de desenvolvimento alvo. Clique em Implementar.

  5. Navegue de volta para os arquivos do pacote clicando no ícone de pasta acima do ícone de implantações. Um recurso run-notebook.job.yml de trabalho foi criado com YAML básico para o trabalho e alguns exemplos adicionais comentados de tarefa de trabalho YAML.

  6. Adicione uma tarefa de bloco de anotações à definição de trabalho. Substitua o exemplo YAML no run-notebook.job.yml arquivo pelo seguinte:

    resources:
      jobs:
        run_notebook:
          name: run-notebook
          queue:
            enabled: true
          tasks:
            - task_key: my-notebook-task
              notebook_task:
                notebook_path: ../helloworld.ipynb
    

    Configuração de tarefas do bloco de anotações de trabalho YAML

Para obter detalhes sobre como definir um trabalho no YAML, consulte trabalho. Para obter a sintaxe YAML para outros tipos de tarefas de trabalho suportados, consulte Adicionar tarefas a trabalhos em Databricks Asset Bundles.

Implantar o pacote

Em seguida, implante o pacote e execute o trabalho que contém a tarefa do helloworld bloco de anotações.

  1. No painel Implantações do pacote, em Destinos, clique na lista suspensa para selecionar o espaço de trabalho de dev destino, caso ainda não esteja selecionado. Os espaços de trabalho de destino são definidos no targets mapeamento do pacote databricks.yml. Consulte Modos de implantação do Databricks Asset Bundle.

    Escolher implantação de destino

  2. Clique no botão Implantar . O pacote é validado e os detalhes da validação aparecem em uma caixa de diálogo.

  3. Revise os detalhes da implantação nesta caixa de diálogo de confirmação para desenvolvimento e clique em Implantar.

    Diálogo de implantação para dev

    Importante

    Implantar pacotes e executar recursos de pacote executa o código como o usuário atual. Certifique-se de confiar no código do pacote, incluindo YAML, que pode conter definições de configuração que executam comandos.

O estado da implantação é apresentado na janela de saída do projeto.

Executar a tarefa

Os recursos do pacote implantado estão listados em Recursos do pacote. Clique no ícone de reprodução associado ao recurso de trabalho para executá-lo.

Listar recursos implantados

Navegue até Execuções de tarefas na barra de navegação esquerda para visualizar a execução do pacote. O nome da execução do trabalho agrupado é prefixado, por exemplo [dev someone] run-notebook.

Próximos passos