Partager via


Aide-mémoire sur la planification de travaux de production

Cet article vise à fournir des conseils clairs et avisés pour la planification de travaux de production. Utiliser les meilleures pratiques peut réduire les coûts, améliorer le niveau de performance et renforcer la sécurité.

Conseil Répercussion Documents
Utiliser des clusters de travaux pour des workflows automatisés Coût : les clusters de travaux sont facturés à des tarifs plus bas que les clusters interactifs.
Redémarrer des clusters de longue durée Sécurité : redémarrez des clusters pour tirer parti de patchs et de correctifs de bogues pour Databricks Runtime.
Utiliser des principaux de service au lieu de comptes d’utilisateur pour exécuter des travaux de production Sécurité : si des travaux sont détenus par des utilisateurs individuels qui quittent l’organisation, il est possible que ces travaux cessent de fonctionner.
Utiliser les Jobs Lakeflow pour l’orchestration dans la mesure du possible Coût : il n’est pas nécessaire d’utiliser des outils externes pour orchestrer si vous orchestrez uniquement des charges de travail sur Azure Databricks.
Utiliser la dernière version LTS de Databricks Runtime Performances et coût : Azure Databricks améliore constamment Databricks Runtime pour plus de facilité d’utilisation, de performances et de sécurité.
Ne stockez pas les données de production dans la racine DBFS Sécurité : quand des données sont stockées dans la racine DBFS, tous les utilisateurs peut y accéder.