Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Vous pouvez automatiser la configuration du catalogue Unity à l’aide du fournisseur Databricks Terraform. Cet article fournit des liens vers le guide de déploiement du catalogue Unity du fournisseur Terraform et la documentation de référence sur les ressources, ainsi que les exigences (« Avant de commencer ») et les conseils de validation et de déploiement.
Avant de commencer
Pour automatiser la configuration du catalogue Unity à l’aide de Terraform, vous devez disposer des éléments suivants :
- Votre compte Azure Databricks doit se trouver sur le plan Premium.
- Dans votre locataire Azure, vous devez avoir l’autorisation de créer :
- Un compte de stockage à utiliser avec Azure Data Lake Storage. Consultez Créer un compte de stockage à utiliser avec Azure Data Lake Storage.
- Une nouvelle ressource pour accueillir une identité gérée attribuée par le système. Cela nécessite que vous soyez
ContributorouOwnerd’un groupe de ressources dans un abonnement quelconque du locataire.
Pour utiliser le fournisseur Databricks Terraform pour configurer un metastore pour Unity Catalog, le stockage pour le metastore, tout stockage externe et toutes leurs informations d’identification d’accès connexes, vous devez disposer des éléments suivants :
Un compte Azure.
Un utilisateur administrateur au niveau du compte dans votre compte Azure.
Sur votre ordinateur de développement local, vous devez disposer des options suivantes :
Interface CLI Terraform. Consultez Télécharger Terraform sur le site web Terraform.
Interface Azure CLI, connectée par le biais de la commande
az loginavec un utilisateur disposant de droitsContributorouOwnersur votre abonnement. Découvrez comment installer Azure CLI. Pour vous connecter avec un compte d’utilisateur ou un principal de service, consultez Se connecter avec Azure CLI.Remarque
Lorsque vous vous authentifiez avec des outils automatisés, des systèmes, des scripts et des applications, c'est une bonne pratique de sécurité de se connecter via la
az logincommande avec un principal de service Microsoft Entra ID. Consultez Se connecter avec un principal de service et s’authentifier auprès du principal de service Azure.
Pour utiliser le fournisseur Databricks Terraform pour configurer tous les autres composants de l’infrastructure du catalogue Unity, vous devez disposer des éléments suivants :
Un espace de travail Azure Databricks.
Sur votre ordinateur de développement local, vous devez disposer des options suivantes :
Interface CLI Terraform. Consultez Télécharger Terraform sur le site web Terraform.
L’une des opérations suivantes :
Databricks CLI version 0.205 ou ultérieure, configurée avec votre jeton d’accès personnel Azure Databricks en exécutant
databricks configure --host <workspace-url> --profile <some-unique-profile-name>. Consultez Installer ou mettre à jour l’interface CLI Databricks et l’authentification par jeton d’accès personnel (déconseillée).Remarque
En guise de bonne pratique de sécurité, lorsque vous vous authentifiez avec des outils, des systèmes, des scripts et des applications automatisés, Databricks vous recommande d’utiliser des jetons d’accès personnels appartenant aux principaux de service au lieu des utilisateurs de l’espace de travail. Pour créer des jetons pour les principaux de service, consultez Gérer les jetons d’un principal de service.
L'Azure CLI, connecté via la commande
az login. Découvrez comment installer Azure CLI. Pour vous connecter avec un compte d’utilisateur ou un principal de service, consultez Se connecter avec Azure CLI.Remarque
Lorsque vous vous authentifiez avec des outils automatisés, des systèmes, des scripts et des applications, c'est une bonne pratique de sécurité de se connecter via la
az logincommande avec un principal de service Microsoft Entra ID. Consultez Se connecter avec un principal de service et s’authentifier auprès du principal de service Azure.Les deux variables d’environnement Azure Databricks suivantes :
-
DATABRICKS_HOST, défini sur la valeur de l’URL de votre instance d’espace de travail, par exemplehttps://dbc-1234567890123456.cloud.databricks.com -
DATABRICKS_TOKEN, défini sur la valeur de votre jeton d’accès personnel Azure Databricks ou du jeton Microsoft Entra ID (anciennement Azure Active Directory). Consultez également Surveiller et révoquer des jetons d’accès personnels.
Pour définir ces variables d’environnement, consultez la documentation de votre système d’exploitation.
Remarque
En guise de bonne pratique de sécurité, lorsque vous vous authentifiez avec des outils, des systèmes, des scripts et des applications automatisés, Databricks vous recommande d’utiliser des jetons d’accès personnels appartenant aux principaux de service au lieu des utilisateurs de l’espace de travail. Pour créer des jetons pour les principaux de service, consultez Gérer les jetons d’un principal de service.
-
Guide de déploiement du catalogue Unity du fournisseur Terraform et documentation de référence sur les ressources
Pour savoir comment déployer tous les prérequis et activer Unity Catalog pour un espace de travail, consultez Déploiement de ressources préalables et activation de Unity Catalog dans la documentation du fournisseur Databricks Terraform.
Si vous disposez déjà de certains composants d’infrastructure du catalogue Unity, vous pouvez utiliser Terraform pour déployer d’autres composants d’infrastructure de catalogue Unity en fonction des besoins. Consultez chaque section du guide référencée dans le paragraphe précédent et la section Catalogue Unity de la documentation du fournisseur Databricks Terraform.
Valider, planifier, déployer ou détruire les ressources
- Pour valider la syntaxe des configurations Terraform sans les déployer, exécutez la
terraform validatecommande. - Pour afficher les actions que Terraform effectuerait pour déployer les configurations, exécutez la
terraform plancommande. Cette commande ne déploie pas réellement les configurations. - Pour déployer les configurations, exécutez la
terraform deploycommande. - Pour supprimer les ressources déployées, exécutez la
terraform destroycommande.