Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article vise à fournir des conseils clairs et avisés pour la planification de travaux de production. Utiliser les meilleures pratiques peut réduire les coûts, améliorer le niveau de performance et renforcer la sécurité.
| Conseil | Répercussion | Documents |
|---|---|---|
| Utiliser des clusters de travaux pour des workflows automatisés | Coût : les clusters de travaux sont facturés à des tarifs plus bas que les clusters interactifs. | |
| Redémarrer des clusters de longue durée | Sécurité : redémarrez des clusters pour tirer parti de patchs et de correctifs de bogues pour Databricks Runtime. | |
| Utiliser des principaux de service au lieu de comptes d’utilisateur pour exécuter des travaux de production | Sécurité : si des travaux sont détenus par des utilisateurs individuels qui quittent l’organisation, il est possible que ces travaux cessent de fonctionner. | |
| Utiliser les Jobs Lakeflow pour l’orchestration dans la mesure du possible | Coût : il n’est pas nécessaire d’utiliser des outils externes pour orchestrer si vous orchestrez uniquement des charges de travail sur Azure Databricks. | |
| Utiliser la dernière version LTS de Databricks Runtime | Performances et coût : Azure Databricks améliore constamment Databricks Runtime pour plus de facilité d’utilisation, de performances et de sécurité. | |
| Ne stockez pas les données de production dans la racine DBFS | Sécurité : quand des données sont stockées dans la racine DBFS, tous les utilisateurs peut y accéder. |