Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este artigo descreve o formato de notebook padrão no Azure Databricks, como alterar o formato do notebook e como gerenciar confirmações de saída se o notebook estiver em uma pasta controlada pela origem.
Por padrão, os notebooks no Databricks são criados no .ipynb formato (IPython ou Jupyter). Você também pode optar por usar o formato original.
Você ainda pode importar e exportar notebooks em vários formatos. Consulte Como importar e exportar notebooks no Databricks.
Formatos de notebook
O Databricks suporta a criação e edição de notebooks em dois formatos: IPYNB (padrão) e código-fonte.
Você pode gerenciar arquivos-fonte, incluindo notebooks, usando repositórios Git. Somente determinados tipos de ativos do Databricks têm suporte em pastas Git. O formato afeta como os notebooks são commitados em repositórios remotos, conforme descrito na tabela abaixo.
| Formato de origem do notebook | Descrição |
|---|---|
| fonte | Um formato básico que captura apenas o código-fonte, com um sufixo que sinaliza a linguagem de código, como .py, .scala.r e .sql. |
| IPYNB (Jupyter) | Um formato avançado que captura código-fonte, ambiente de notebook, definições de visualização, widgets de notebook e saídas opcionais. Um notebook IPYNB pode conter código em qualquer idioma compatível com notebooks do Databricks (apesar da parte py de .ipynb). Ao usar o formato IPYNB, opcionalmente, você pode controlar a saída de um notebook junto com o notebook. |
O formato IPYNB também dá suporte a uma melhor experiência de exibição para blocos de anotações do Databricks em repositórios Git remotos. Se você usar o GitHub ou o GitLab, poderá habilitar recursos que oferecem diferenças aprimoradas dos seus notebooks nas solicitações de pull, facilitando a exibição e a revisão de código de alterações em um notebook.
Para saber mais sobre o suporte do GitHub para as versões avançadas de notebooks IPYNB, consulte Visualização de recursos: Difusões ricas do Jupyter Notebook. Para saber mais sobre o suporte do GitLab para diferenças de notebook IPYNB, consulte Arquivos do Jupyter Notebook.
Para distinguir os blocos de anotações de formato de origem dos arquivos Python, Scala e SQL regulares, o Azure Databricks adiciona o comentário “Databricks notebook source” à parte superior dos notebooks Python, Scala e SQL. Esse comentário garante que o Azure Databricks analise corretamente o arquivo como um notebook em vez de um arquivo de script.
Alterar a configuração de formato padrão do notebook
Notebooks IPYNB são o formato padrão ao criar um novo notebook no Azure Databricks.
Para alterar o padrão para o formato de origem do Azure Databricks, faça login no espaço de trabalho do Azure Databricks, clique no seu perfil no canto superior direito da página, clique em Configurações e vá até Desenvolvedor. Altere o formato padrão do notebook nas configurações do Editor.
Converter o formato do notebook
Você pode converter um notebook existente em outro formato por meio da interface do usuário do Azure Databricks.
Para converter um notebook existente em outro formato:
Abra o bloco de anotações em sua área de trabalho.
Selecione Arquivo no menu do workspace, selecione o formato do Notebook e escolha o formato desejado. Você pode escolher Jupyter (.ipynb) (Recomendado) ou Origem (.scala, .py, .sql, .r). O formato atual do notebook está acinzentado e tem uma marca de seleção ao lado dele.
Para obter mais informações sobre os tipos de notebooks com suporte no Azure Databricks, consulte Importar e exportar notebooks do Databricks.
Gerenciar confirmações de saída do notebook IPYNB
As saídas são os resultados da execução de um notebook na plataforma Databricks, incluindo exibições de tabela e visualizações. Quanto aos notebooks IPYNB nas pastas controladas pelo código-fonte, você pode gerenciar como as saídas do notebook são confirmadas no repositório remoto.
Permitir a confirmação da saída do notebook .ipynb
As saídas só poderão ser confirmadas se um administrador de workspace tiver habilitado esse recurso. Por padrão, a configuração administrativa das pastas Git não permite que a saída do notebook .ipynb seja confirmada. Se você tiver privilégios de administrador para o workspace, poderá alterar essa configuração:
Vá para configurações do administrador>configurações de workspace no console de administrador do Azure Databricks.
Em pastas git, escolha Permitir que as pastas Git exportem as saídas IPYNB e selecione Permitir: saídas IPYNB podem ser alternadas em.
Importante
Quando as saídas são incluídas, as configurações de visualização e painel são incluídas nos notebooks.ipynb que você cria.
Confirmações do artefato de saída do notebook IPYNB de controle
Quando você confirma um .ipynb arquivo, o Databricks cria um arquivo de configuração que permite controlar como você confirma saídas: .databricks/commit_outputs.
Se você tiver um arquivo de notebook
.ipynb, mas nenhum arquivo de configuração no seu repositório remoto, acesse a caixa de diálogo Status do Git.Na caixa de diálogo de notificação, selecione Criar arquivo de configuração commit_outputs.
Você também pode gerar arquivos de configuração no menu Arquivo . O menu Arquivo possui um controle para atualizar automaticamente o arquivo de configuração, no qual você pode especificar a inclusão ou exclusão de saídas de um caderno IPYNB específico.
No menu Arquivo, selecione Confirmar as saídas dos notebooks.
Na caixa de diálogo, confirme sua escolha para confirmar as saídas do notebook.