Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Seuls certains types de ressources Azure Databricks sont pris en charge par les dossiers Git. Cet article détaille les types de ressources pris en charge et explique comment les utiliser avec des dossiers Git. Lorsqu’un type de ressource est pris en charge dans les dossiers Git, cela signifie qu’il peut être sérialisé, mis en gestion de version, et poussé au dépôt Git de support.
Types de ressources pris en charge par les dossiers Git
Les types de ressources pris en charge sont les suivants :
| Type de ressource | Détails |
|---|---|
| Fichier | Les fichiers sont des données sérialisées et peuvent inclure des bibliothèques, des fichiers binaires, du code, des images. Pour plus d’informations, consultez Qu’est-ce que les fichiers d’espace de travail ?. |
| Notebook | Les notebooks désignent spécifiquement les formats de fichiers de notebooks pris en charge par Databricks. Les notebooks sont considérés comme un type de ressource Azure Databricks distinct des fichiers, car ils ne sont pas sérialisés. Les dossiers Git déterminent un notebook selon l’extension de fichier (par exemple .ipynb) ou selon les extensions de fichier combinées à un marqueur spécial dans le contenu du fichier (par exemple, un commentaire # Databricks notebook source au début des fichiers source .py). |
| Dossier | Un dossier est une structure spécifique à Azure Databricks qui représente des informations sérialisées sur un regroupement logique de fichiers dans Git. Comme prévu, l’utilisateur l’utilise en tant que « dossier » lors de l’affichage d’un dossier Git Azure Databricks ou de son accès avec l’interface CLI Azure Databricks. |
| Requête (préversion publique) | Les requêtes Databricks SQL (DBSQL) (.dbquery.ipynb) peuvent être validées sous forme de notebooks IPYNB. La prise en charge git des requêtes DBSQL nécessite l’activation du nouvel éditeur SQL. Les requêtes créées avec la nouvelle fonctionnalité éditeur SQL désactivée peuvent être placées dans un dossier Git, mais ne peuvent pas être validées dans le référentiel distant. |
| Tableau de bord (préversion publique) | Les brouillons du tableau de bord Databricks AI/BI (.lvdash.json) peuvent être validés en tant que fichiers JSON. Les configurations de publication et de planification, telles que la sélection de l’entrepôt et la création de planification, ne sont pas suivies. |
| Alertes (préversion publique) | Les alertes peuvent être enregistrées en tant que fichiers JSON avec des extensions .dbalert.json. Les planifications d’alerte sont suivies dans les fichiers d’alerte. Les alertes nouvellement clonées ont des plannings en pause et doivent être reprises explicitement par les utilisateurs. |
Lorsque vous utilisez vos ressources dans Git, observez les limitations suivantes dans le nommage de fichier :
- Un dossier ne peut pas contenir de bloc-notes portant le même nom qu’un autre bloc-notes, un fichier ou un dossier dans le même référentiel Git, même si l’extension de fichier diffère. (Pour les notebooks au format source, l’extension est
.pypour Python,.scalapour Scala,.sqlpour SQL et.rpour R. Pour les notebooks au format IPYNB, l’extension est.ipynb.) Par exemple, vous ne pouvez pas utiliser un bloc-notes au format source nommétest1.pyet un notebook IPYNB nommétest1dans le même dossier Git, car le fichier de notebook Python au format source (test1.py) sera sérialisé commetest1et un conflit se produira. - Le caractère
/n’est pas pris en charge dans les noms de fichiers. Par exemple, vous ne pouvez pas avoir de fichier nomméi/o.pydans votre dossier Git.
Si vous tentez d’effectuer des opérations Git sur des fichiers avec des noms qui ont ces modèles, vous obtenez un message « Erreur lors de l’extraction de l’état Git ». Si vous recevez cette erreur de façon inattendue, passez en revue les noms de fichiers des ressources dans votre dépôt Git. Si vous trouvez des fichiers avec des noms qui ont ces modèles en conflit, renommez-les et réessayez l’opération.
Types de ressources non pris en charge
Remarque
Vous pouvez déplacer des ressources existantes non prises en charge dans un dossier Git, mais vous ne pouvez pas valider les modifications apportées au référentiel distant.
Les types de ressources Azure Databricks qui ne sont pas pris en charge dans les dossiers Git incluent les éléments suivants :
- Alertes héritées
- Tableaux de bord hérités
- Expériences
- Espaces Genie
Formats de bloc-notes
Pour plus d’informations sur les formats de notebook pour les dossiers Git, consultez Les formats notebook.