Partager via


Concepts de dossiers Git pour Azure Databricks

Les dossiers Git Azure Databricks sont un client Et une API Git visuels qui intègrent des dépôts Git au sein de votre espace de travail. Utilisez des dossiers Git pour développer du code dans des notebooks et des fichiers tout en suivant les bonnes pratiques de développement logiciel à l’aide de Git pour le contrôle de version, la collaboration et CI/CD. Les répertoires Git prennent en charge les opérations Git courantes telles que le clonage d’un référentiel, le commit et le push, l’extraction, la gestion des branches et la comparaison visuelle des différences lors du commit.

Cette page couvre :

Fonctionnalités des dossiers Git

Les dossiers Git Azure Databricks fournissent un contrôle de code source pour les projets de données et d’IA en intégrant des fournisseurs Git.

Utilisez les fonctionnalités Git de votre espace de travail Azure Databricks pour :

  • Cloner un dépôt Git distant, pousser (push) vers celui-ci et tirer (pull) depuis celui-ci.
  • Créer et gérer des branches pour les travaux de développement, notamment la fusion, le rebasage et la résolution des conflits.
  • Créez des blocs-notes, y compris des notebooks IPYNB, puis modifiez-les et d’autres fichiers.
  • Comparer visuellement les différences lors de la validation et résoudre les conflits de fusion.

Pour obtenir des instructions pas à pas, consultez Exécuter des opérations Git sur les dossiers Git Databricks.

API Répertoires Git

Les dossiers Git Azure Databricks ont une API pour s’intégrer à votre pipeline CI/CD. Par exemple, mettez à jour par programme un dossier Git d’espace de travail afin qu’il dispose toujours de la version la plus récente du code. Pour plus d’informations sur les meilleures pratiques pour le développement de code à l’aide de dossiers Git Azure Databricks, consultez CI/CD avec les dossiers Git Databricks.

Fournisseurs Git

Un fournisseur Git est un service qui héberge un système de contrôle de code source basé sur Git. Ces plateformes sont fournies sous deux formes principales : un service cloud hébergé par le fournisseur ou un service local que votre organisation installe et gère sur son propre matériel. De nombreux fournisseurs, y compris GitHub, Microsoft, GitLab et Atlassian, offrent des options SaaS cloud et locales (souvent appelées « auto-managées »).

Les dossiers Git Azure Databricks utilisent un référentiel Git intégré. Les fournisseurs Git cloud ou d’entreprise répertoriés dans les sections suivantes peuvent héberger le référentiel.

Lorsque vous sélectionnez un fournisseur Git pendant la configuration, vérifiez que vous comprenez les différences entre le cloud (SaaS) et les systèmes locaux. Les organisations hébergent souvent des fournisseurs auto-gérés derrière un VPN, ce qui peut les rendre inaccessibles à partir de l’Internet public. Ces versions incluent souvent « Serveur » ou « Auto-géré » dans leurs noms. Si vous ne savez pas qui utilise votre organisation, consultez la documentation de votre fournisseur ou demandez à vos administrateurs d’entreprise.

Si votre fournisseur Git cloud n’apparaît pas dans la liste des fournisseurs pris en charge, le choix de GitHub peut fonctionner comme une solution de secours, bien que cela ne soit pas garanti.

Note

Si vous utilisez GitHub en tant que fournisseur et que vous ne savez pas si vous utilisez le cloud ou la version locale, consultez À propos de GitHub Enterprise Server dans la documentation GitHub.

Fournisseurs Git cloud pris en charge

Les dossiers Git Azure Databricks s’intègrent aux fournisseurs Git basés sur le cloud suivants :

  • GitHub, GitHub Advanced Enterprise et GitHub Enterprise Cloud
  • Atlassian Bitbucket Cloud
  • GitLab et GitLab Enterprise Edition
  • Microsoft Azure DevOps (Azure Repos)

Fournisseurs Git locaux pris en charge

Les dossiers Git Azure Databricks s’intègrent aux fournisseurs Git locaux suivants :

  • GitHub Enterprise Server
  • Atlassian Bitbucket Serveur et Centre de Données
  • GitLab Autogéré
  • Microsoft Azure DevOps Server : un administrateur d’espace de travail doit explicitement autoriser les préfixes de domaine dans l'URL pour votre serveur Microsoft Azure DevOps si l'URL ne correspond pas à dev.azure.com/* ou visualstudio.com/*. Consultez les listes d’autorisation d’URL Git.

Si vous intégrez un dépôt Git local qui n’est pas accessible à partir d’Internet, vous devez également installer un proxy pour les demandes d’authentification Git au sein du VPN de votre entreprise. Consultez Configurer la connectivité Git privée pour les dossiers Git Azure Databricks.

Pour découvrir comment utiliser des jetons d’accès avec votre fournisseur Git, consultez Configurer des informations d’identification Git et connecter un dépôt distant à Azure Databricks.

Étapes suivantes