Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette page explique comment utiliser et activer le calcul serverless dans Azure Databricks.
Qu’est-ce que le calcul Serverless ?
Le calcul serverless est un service géré par Azure Databricks qui vous permet de vous connecter rapidement aux ressources informatiques à la demande.
Lorsque vous choisissez d’utiliser le calcul serverless, vous pouvez exécuter des charges de travail sans provisionner de ressources de calcul dans votre compte cloud. Au lieu de cela, Databricks alloue et gère automatiquement les ressources de calcul nécessaires. Cela accélère les temps de démarrage et de mise à l’échelle, réduit le temps d’inactivité et réduit la nécessité de gérer les ressources de calcul.
De nombreuses fonctionnalités d’Azure Databricks s’exécutent sur le calcul serverless. Utilisez les pages suivantes pour apprendre à utiliser le calcul serverless dans différentes fonctionnalités :
- Notebooks serverless
- Travaux serverless
- Entrepôts SQL sans serveur
- Pipelines déclaratifs Lakeflow Serverless Spark
- Formation de modèle d’IA mosaïque - prévision
Configuration requise pour le calcul serverless
Pour accéder au calcul serverless, votre espace de travail doit répondre aux exigences suivantes :
- Le catalogue Unity doit être activé.
- Doit se trouver dans une région prise en charge pour le calcul serverless. Consultez Fonctionnalités avec une disponibilité régionale limitée.
- Ne doit pas avoir PCI-DSS activé dans le profil de sécurité de conformité. Consultez PCI DSS v4.0.
Limitations du calcul serverless
Pour obtenir la liste des limitations, consultez Limitations du calcul serverless.
Forum aux questions (FAQ)
- Comment les versions sont-elles déployées ?
- Comment déterminer quelle version serverless j’exécute ?
- Comment estimer les coûts pour serverless ?
- Comment analyser l’utilisation de DBU pour une charge de travail spécifique ?
- Existe-t-il un décalage entre l’exécution d’un travail ou d’une requête et l’apparition des frais dans la table système d’utilisation facturable ?
- Je n’ai pas activé le calcul serverless pour les travaux et notebooks. Pourquoi des enregistrements de facturation apparaissent-ils pour des travaux serverless ?
- Le calcul serverless prend-il en charge les dépôts privés ?
- Comment installer des bibliothèques pour mes tâches de travail ?
- Puis-je me connecter à des sources de données personnalisées ?
- Comment fonctionne la mise en réseau du plan de calcul serverless ?
- Puis-je configurer le calcul serverless pour les travaux avec les packs de ressources Databricks ?
- Comment exécuter ma charge de travail serverless à partir de mon ordinateur de développement local ou de mon application de données ?
Comment les versions sont-elles déployées ?
Le calcul serverless est un produit sans version, ce qui signifie que Databricks met automatiquement à niveau le runtime de calcul serverless pour prendre en charge les améliorations et les mises à niveau vers la plateforme. Tous les utilisateurs obtiennent les mêmes mises à jour, déployées sur une courte période de temps.
Comment déterminer quelle version serverless j’exécute ?
Les charges de travail serverless s’exécutent toujours sur la version du runtime la plus récente. Consultez les Notes de publication pour connaître la version la plus récente.
Comment estimer les coûts pour serverless ?
Databricks recommande d’exécuter et d’évaluer une charge de travail représentative ou spécifique, puis d’analyser la table système de facturation. Consultez Référence de table système d’utilisation facturable.
Comment analyser l’utilisation de DBU pour une charge de travail spécifique ?
Pour voir le coût d’une charge de travail spécifique, interrogez la table système system.billing.usage. Consultez Surveiller le coût du calcul serverless pour obtenir des exemples de requêtes et télécharger notre tableau de bord d’observabilité des coûts.
Existe-t-il un décalage entre l’exécution d’un travail ou d’une requête et l’apparition des frais dans la table système d’utilisation facturable ?
Oui, il peut y avoir jusqu’à un délai de 24 heures entre l’exécution d’une charge de travail et son utilisation reflétée dans la table système d’utilisation facturable.
Je n’ai pas activé le calcul serverless pour les travaux et notebooks. Pourquoi des enregistrements de facturation apparaissent-ils pour des travaux serverless ?
La surveillance de la qualité des données et l’optimisation prédictive sont également facturées sous la référence SKU des travaux serverless.
Il n’est pas nécessaire que le calcul serverless soit activé pour utiliser ces deux fonctionnalités.
Le calcul serverless prend-il en charge les dépôts privés ?
Les référentiels peuvent être privés ou nécessiter une authentification. Pour des raisons de sécurité, une URL pré-signée est requise lors de l’accès aux référentiels authentifiés.
Comment installer des bibliothèques pour mes tâches de travail ?
Databricks recommande d’utiliser des environnements pour installer et gérer des bibliothèques pour vos travaux. Consultez Configurer l’environnement pour les tâches de travail.
Puis-je me connecter à des sources de données personnalisées ?
Non, seules les sources qui utilisent Lakehouse Federation sont prises en charge. Consultez Sources de données prises en charge
Comment fonctionne la mise en réseau du plan de calcul serverless ?
Les ressources de calcul serverless s’exécutent dans le plan de calcul serverless, qui est géré par Azure Databricks. Pour plus d’informations sur le réseau et l’architecture, consultez l’article Mise en réseau du plan de calcul serverless.
Puis-je configurer le calcul serverless pour les travaux avec les packs de ressources Databricks ?
Oui, il est possible d’utiliser les packs de ressources Databricks pour configurer des travaux qui utilisent le calcul serverless. Consultez Travail utilisant le calcul serverless.
Comment exécuter ma charge de travail serverless à partir de mon ordinateur de développement local ou de mon application de données ?
Databricks Connect vous permet de vous connecter à Databricks à partir de votre ordinateur local et d’exécuter des charges de travail sur serverless. Consultez Qu’est-ce que Databricks Connect ?.