Partilhar via


Concepções de pastas Git no Azure Databricks

As pastas Git do Azure Databricks são um cliente Git visual e uma API que integra repositórios Git em seu espaço de trabalho. Use pastas Git para desenvolver código em blocos de anotações e arquivos enquanto segue as práticas recomendadas de desenvolvimento de software usando o Git para controle de versão, colaboração e CI/CD. As pastas Git suportam operações comuns do Git, como clonar um repositório, confirmar e enviar, puxar, gerenciar ramificações e comparar visualmente diffs ao confirmar.

Esta página abrange:

Capacidades de repositórios Git

As pastas Git do Azure Databricks fornecem controle de origem para dados e projetos de IA integrando-se com provedores Git.

Use a funcionalidade Git do seu espaço de trabalho do Azure Databricks para:

  • Clonar, enviar para e obter de um repositório Git remoto.
  • Crie e gerencie ramificações para o trabalho de desenvolvimento, incluindo fusão, refundação e resolução de conflitos.
  • Crie blocos de notas, incluindo blocos de notas IPYNB, e edite-os e outros ficheiros.
  • Compare visualmente as diferenças ao confirmar e resolver conflitos de mesclagem.

Para obter instruções passo a passo, consulte Executar operações Git em pastas Git Databricks.

API de pastas Git

As pastas Git do Azure Databricks têm uma API para integrar com seu pipeline de CI/CD. Por exemplo, atualize programaticamente uma pasta Git do espaço de trabalho para que ela sempre tenha a versão mais recente do código. Para obter informações sobre práticas recomendadas para desenvolvimento de código usando pastas Git do Azure Databricks, consulte CI/CD com pastas Git Databricks.

Provedores Git

Um provedor Git é um serviço que hospeda um sistema de controle de origem baseado em Git. Essas plataformas vêm em duas formas principais: um serviço de nuvem hospedado pelo fornecedor ou um serviço local que sua organização instala e gerencia em seu próprio hardware. Muitos provedores, incluindo GitHub, Microsoft, GitLab e Atlassian, oferecem SaaS na nuvem e opções locais (muitas vezes chamadas de "autogerenciadas").

As pastas Git do Azure Databricks usam um repositório Git integrado. Qualquer um dos provedores de Git corporativos ou de nuvem listados nas seções a seguir pode hospedar o repositório.

Ao selecionar um provedor Git durante a configuração, certifique-se de entender as diferenças entre a nuvem (SaaS) e os sistemas locais. As organizações geralmente hospedam provedores autogerenciados por trás de uma VPN, o que pode torná-los inacessíveis a partir da Internet pública. Essas versões geralmente incluem "Server" ou "Self-Managed" em seus nomes. Se você não tiver certeza de qual deles sua organização usa, verifique a documentação do seu provedor ou pergunte aos administradores da sua empresa.

Se o seu provedor Git na nuvem não aparecer na lista de provedores suportados, escolher o GitHub pode funcionar como um fallback, embora isso não seja garantido.

Observação

Se você estiver usando o GitHub como um provedor e ainda não tiver certeza se está usando a versão na nuvem ou local, consulte Sobre o GitHub Enterprise Server nos documentos do GitHub.

Provedores de Git na nuvem suportados

As pastas Git do Azure Databricks integram-se com os seguintes fornecedores Git baseados na nuvem:

  • GitHub, GitHub Advanced Enterprise e GitHub Enterprise Cloud
  • Atlassian Cloud Bitbucket
  • GitLab e GitLab Enterprise Edition
  • DevOps do Microsoft Azure (repositórios do Azure)

Provedores de Git locais suportados

As pastas Git do Azure Databricks integram-se com os seguintes provedores Git locais:

  • Servidor GitHub Enterprise
  • Atlassian Bitbucket Server e Centro de Dados
  • Self-Managed GitLab
  • Servidor de DevOps do Microsoft Azure: um administrador de espaço de trabalho deve permitir explicitamente a lista de prefixos de domínio de URL para seu Servidor de DevOps do Microsoft Azure se a URL não corresponder dev.azure.com/* ou visualstudio.com/*. Veja listas de permissões URL do Git.

Se você estiver integrando um repositório Git local que não esteja acessível pela Internet, também deverá instalar um proxy para solicitações de autenticação do Git dentro da VPN da sua empresa. Veja Configurar a conectividade privada do Git para pastas Git do Azure Databricks.

Para saber como usar tokens de acesso com seu provedor Git, consulte Configurar credenciais do Git & conectar um repositório remoto ao Azure Databricks.

Próximos passos