Compartilhar via


Gerenciar o formato do bloco de anotações

Este artigo descreve o formato de notebook padrão no Azure Databricks, como alterar o formato do notebook e como gerenciar confirmações de saída se o notebook estiver em uma pasta controlada pela origem.

Por padrão, os notebooks no Databricks são criados no .ipynb formato (IPython ou Jupyter). Você também pode optar por usar o formato original.

Você ainda pode importar e exportar notebooks em vários formatos. Consulte Como importar e exportar notebooks no Databricks.

Formatos de notebook

O Databricks suporta a criação e edição de notebooks em dois formatos: IPYNB (padrão) e código-fonte.

Você pode gerenciar arquivos-fonte, incluindo notebooks, usando repositórios Git. Somente determinados tipos de ativos do Databricks têm suporte em pastas Git. O formato afeta como os notebooks são commitados em repositórios remotos, conforme descrito na tabela abaixo.

Formato de origem do notebook Descrição
fonte Um formato básico que captura apenas o código-fonte, com um sufixo que sinaliza a linguagem de código, como .py, .scala.r e .sql.
IPYNB (Jupyter) Um formato avançado que captura código-fonte, ambiente de notebook, definições de visualização, widgets de notebook e saídas opcionais. Um notebook IPYNB pode conter código em qualquer idioma compatível com notebooks do Databricks (apesar da parte py de .ipynb). Ao usar o formato IPYNB, opcionalmente, você pode controlar a saída de um notebook junto com o notebook.

O formato IPYNB também dá suporte a uma melhor experiência de exibição para blocos de anotações do Databricks em repositórios Git remotos. Se você usar o GitHub ou o GitLab, poderá habilitar recursos que oferecem diferenças aprimoradas dos seus notebooks nas solicitações de pull, facilitando a exibição e a revisão de código de alterações em um notebook.

Para saber mais sobre o suporte do GitHub para as versões avançadas de notebooks IPYNB, consulte Visualização de recursos: Difusões ricas do Jupyter Notebook. Para saber mais sobre o suporte do GitLab para diferenças de notebook IPYNB, consulte Arquivos do Jupyter Notebook.

Para distinguir os blocos de anotações de formato de origem dos arquivos Python, Scala e SQL regulares, o Azure Databricks adiciona o comentário “Databricks notebook source” à parte superior dos notebooks Python, Scala e SQL. Esse comentário garante que o Azure Databricks analise corretamente o arquivo como um notebook em vez de um arquivo de script.

Alterar a configuração de formato padrão do notebook

Notebooks IPYNB são o formato padrão ao criar um novo notebook no Azure Databricks.

Para alterar o padrão para o formato de origem do Azure Databricks, faça login no espaço de trabalho do Azure Databricks, clique no seu perfil no canto superior direito da página, clique em Configurações e vá até Desenvolvedor. Altere o formato padrão do notebook nas configurações do Editor.

Alterar o formato de bloco de anotações padrão nas configurações do desenvolvedor do seu perfil

Converter o formato do notebook

Você pode converter um notebook existente em outro formato por meio da interface do usuário do Azure Databricks.

Para converter um notebook existente em outro formato:

  1. Abra o bloco de anotações em sua área de trabalho.

  2. Selecione Arquivo no menu do workspace, selecione o formato do Notebook e escolha o formato desejado. Você pode escolher Jupyter (.ipynb) (Recomendado) ou Origem (.scala, .py, .sql, .r). O formato atual do notebook está acinzentado e tem uma marca de seleção ao lado dele.

    O menu de arquivo da área de trabalho, expandido, mostrando a opção de formato de notebook.

Para obter mais informações sobre os tipos de notebooks com suporte no Azure Databricks, consulte Importar e exportar notebooks do Databricks.

Gerenciar confirmações de saída do notebook IPYNB

As saídas são os resultados da execução de um notebook na plataforma Databricks, incluindo exibições de tabela e visualizações. Quanto aos notebooks IPYNB nas pastas controladas pelo código-fonte, você pode gerenciar como as saídas do notebook são confirmadas no repositório remoto.

Permitir a confirmação da saída do notebook .ipynb

As saídas só poderão ser confirmadas se um administrador de workspace tiver habilitado esse recurso. Por padrão, a configuração administrativa das pastas Git não permite que a saída do notebook .ipynb seja confirmada. Se você tiver privilégios de administrador para o workspace, poderá alterar essa configuração:

  1. Vá para configurações do administrador>configurações de workspace no console de administrador do Azure Databricks.

  2. Em pastas git, escolha Permitir que as pastas Git exportem as saídas IPYNB e selecione Permitir: saídas IPYNB podem ser alternadas em.

    Console de administração: permitir que pastas Git exportem saídas IPYNB.

Importante

Quando as saídas são incluídas, as configurações de visualização e painel são incluídas nos notebooks.ipynb que você cria.

Confirmações do artefato de saída do notebook IPYNB de controle

Quando você confirma um .ipynb arquivo, o Databricks cria um arquivo de configuração que permite controlar como você confirma saídas: .databricks/commit_outputs.

  1. Se você tiver um arquivo de notebook .ipynb, mas nenhum arquivo de configuração no seu repositório remoto, acesse a caixa de diálogo Status do Git.

  2. Na caixa de diálogo de notificação, selecione Criar arquivo de configuração commit_outputs.

    Interface do usuário de confirmação do notebook: criar o botão do arquivo commit_outputs.

Você também pode gerar arquivos de configuração no menu Arquivo . O menu Arquivo possui um controle para atualizar automaticamente o arquivo de configuração, no qual você pode especificar a inclusão ou exclusão de saídas de um caderno IPYNB específico.

  1. No menu Arquivo, selecione Confirmar as saídas dos notebooks.

    Editor do notebook: confirmar status e controle das saídas dos notebooks.

  2. Na caixa de diálogo, confirme sua escolha para confirmar as saídas do notebook.

    Caixa de diálogo Confirmar saídas dos notebooks.