Configurer le calcul pour les projets

Cet article contient des recommandations et des ressources pour la configuration des ressources de calcul pour les jobs Lakeflow.

Important

Les limitations du calcul serverless pour les projets sont les suivantes :

Aucune prise en charge de la planification continue.
Aucune prise en charge des déclencheurs d’intervalle par défaut ou basés sur le temps dans Structured Streaming.

Pour plus de limitations, consultez Limitations du calcul serverless.

Chaque projet peut comporter une ou plusieurs tâches. Définissez des ressources de calcul pour chaque tâche. Plusieurs tâches définies pour le même projet peuvent utiliser la même ressource de calcul.

Image présentant un projet avec plusieurs prises et les ressources de capacité de calcul cloud associées.

Quel est le calcul recommandé pour chaque tâche ?

Le tableau suivant indique les types de capacité de calcul recommandés et pris en charge pour chaque type de tâche.

Remarque

Le calcul serverless pour les projets présente des limitations et ne prend pas en charge toutes les charges de travail. Consultez Limitations du calcul serverless.

Tâche	Capacité de calcul recommandée	Calcul pris en charge
Blocs-notes	Projets serverless	Projets serverless, projets classiques, à usage universel classique
Script Python	Projets serverless	Projets serverless, projets classiques, à usage universel classique
Roue Python	Projets serverless	Projets serverless, projets classiques, à usage universel classique
SQL	Entrepôt SQL serverless	Entrepôt SQL serverless, entrepôt SQL pro
Pipelines déclaratifs Lakeflow Spark	Pipeline serverless	Pipeline serverless, pipeline classique
dbt	Entrepôt SQL serverless	Entrepôt SQL serverless, entrepôt SQL pro
Commandes CLI dbt	Projets serverless	Projets serverless, projets classiques, à usage universel classique
JARRE	Projets classiques	Projets classiques, à usage universel classique
Envoi Spark	Projets classiques	Projets classiques

La tarification des travaux Lakeflow est liée au calcul utilisé pour exécuter des tâches. Pour plus d’informations, consultez Tarification Databricks.

Comment faire pour configurer la capacité de calcul pour les projets ?

Le calcul des travaux classiques est configuré directement à partir de l’interface utilisateur des travaux Lakeflow, et ces configurations font partie de la définition du travail. Tous les autres types de capacité de calcul disponibles stockent leurs configurations avec d’autres ressources d’espace de travail. Le tableau suivant fournit plus de détails :

Type de capacité de calcul	Détails
Capacité de calcul classique	Vous configurez la capacité de calcul pour les projets classiques à l’aide de la même IU et des mêmes paramètres que ceux disponibles pour le calcul à usage général. Consultez Informations de référence sur la configuration de calcul.
Calcul serverless pour les travaux	Le calcul serverless pour les projets constitue la valeur par défaut pour toutes les tâches qui le prennent en charge. Databricks gère les paramètres de capacité de calcul pour le calcul serverless. Consultez Exécuter vos travaux Lakeflow avec un calcul serverless pour les flux de travail.
Entrepôts SQL	Les entrepôts SQL serverless et pro sont configurés par les administrateurs de l’espace de travail ou les utilisateurs disposant de privilèges de création de groupement illimités. Vous configurez les tâches à exécuter sur des entrepôts SQL existants. Consultez Se connecter à un entrepôt SQL.
Calcul des pipelines déclaratifs Lakeflow Spark	Vous configurez les paramètres de calcul pour les pipelines déclaratifs Spark Lakeflow pendant la configuration du pipeline. Consultez Configurer le calcul classique pour les pipelines. Azure Databricks gère les ressources de calcul pour les pipelines déclaratifs Spark Lakeflow serverless. Voir Configurer un pipeline serverless.
Calcul à usage général	Vous pouvez éventuellement configurer des tâches à l’aide du calcul à usage général classique. Databricks ne recommande pas cette configuration pour les projets de production. Consultez Référence de configuration de capacité de calcul et Le calcul à usage général doit-il être utilisé pour les projets ?

Configurez les tâches pour utiliser les mêmes ressources de capacité de calcul de projets pour optimiser l’utilisation des ressources avec des projets qui orchestrent plusieurs tâches. Le partage de la capacité de calcul entre les tâches peut réduire la latence associée aux temps de démarrage.

Vous pouvez utiliser une seule ressource de capacité de calcul pour exécuter toutes les tâches qui font partie du projet ou plusieurs ressources optimisées pour des charges de travail spécifiques. Toute capacité de calcul configurée dans le cadre d’un projet est disponible pour toutes les autres tâches du projet.

Le tableau suivant met en évidence les différences entre la capacité de calcul du projet configurée pour une seule tâche et la capacité de calcul du projet partagé entre plusieurs tâches :

	Une seule tâche	Partagée entre les tâches
Démarrer	Lorsque l’exécution de la tâche commence.	Lorsque la première exécution de tâche configurée pour utiliser la ressource de capacité de calcul commence.
Terminer.	Une fois la tâche exécutée.	Après l’exécution de la dernière tâche configurée pour utiliser la ressource de capacité de calcul.
Calcul inactif	Non applicable.	La capacité de calcul reste active et inactive pendant que les tâches n’utilisant pas la ressource de capacité de calcul s’exécutent.

Un cluster de travail partagé est limité à une seule exécution de travail et ne peut pas être utilisé par d’autres travaux ou d’autres exécutions du même travail.

Les bibliothèques ne peuvent pas être déclarées dans la configuration d’un cluster de travail partagé. Vous devez ajouter des bibliothèques dépendantes dans les paramètres de tâche.

Réviser, configurer et basculer la capacité de calcul des projets

La section Capacité de calcul dans le panneau Détails de projet répertorie toutes les capacités de calcul configurées pour les tâches du projet en cours.

Les tâches configurées pour utiliser une ressource de capacité de calcul sont mises en évidence dans le graphique de tâche lorsque vous passez sur la spécification de capacité de calcul.

Utilisez le bouton Basculer pour modifier la capacité de calcul pour toutes les tâches associées à une ressource de capacité de calcul.

Les ressources de capacité de calcul de projets classique disposent d’une option Configurer. D’autres ressources de capacité de calcul vous permettent de consulter et de modifier les détails de configuration de la capacité de calcul.

Plus d’informations

Pour plus d’informations sur la configuration des travaux classiques Azure Databricks, consultez les meilleures pratiques pour la configuration des travaux Lakeflow classiques.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2025-10-08