Partager via


Créer un espace de travail

Cet article présente les options de création et de gestion des espaces de travail.

Qu’est-ce qu’un espace de travail ?

Un espace de travail est un déploiement Azure Databricks dans un compte de service cloud. Il fournit un environnement unifié pour l’utilisation des ressources Azure Databricks pour un ensemble d’utilisateurs spécifié.

Il existe deux types d’espaces de travail Databricks disponibles :

  • Espaces de travail serverless (préversion publique) : déploiement d’un espace de travail dans votre compte Databricks préconfiguré avec le calcul serverless et le stockage par défaut pour fournir une expérience entièrement serverless. Vous pouvez toujours vous connecter à votre stockage cloud à partir d’espaces de travail serverless.
  • Espaces de travail classiques : déploiement d’un espace de travail dans votre compte Databricks qui provisionne des ressources de stockage et de calcul dans votre compte cloud existant. Le calcul serverless est toujours disponible dans les espaces de travail classiques.

Spécifications

Avant de créer un espace de travail Azure Databricks, vous devez disposer d’un abonnement Azure qui n’est pas un abonnement d’essai gratuit.

Si vous disposez d’un compte gratuit, procédez comme suit :

  1. Accédez à votre profil et remplacez votre abonnement par paiement à l’utilisation. Consultez le compte gratuit Azure.
  2. Supprimez la limite de dépense.
  3. Demandez une augmentation de quota pour les processeurs virtuels dans votre région.

Autorisations Azure requises

Pour créer un espace de travail Azure Databricks, vous devez être l’un des éléments suivants :

  • Un utilisateur disposant du rôle Contributeur ou Propriétaire Azure au niveau de l’abonnement.

  • Un utilisateur disposant d’une définition de rôle personnalisée qui a la liste d’autorisations suivante :

    • Microsoft.Databricks/workspaces/*
    • Microsoft.Resources/subscriptions/resourceGroups/read
    • Microsoft.Resources/subscriptions/resourceGroups/write
    • Microsoft.Databricks/accessConnectors/*
    • Microsoft.Compute/register/action
    • Microsoft.ManagedIdentity/register/action
    • Microsoft.Storage/register/action
    • Microsoft.Network/register/action
    • Microsoft.Resources/deployments/validate/action
    • Microsoft.Resources/deployments/write
    • Microsoft.Resources/deployments/read

Note

Les autorisations Microsoft.Compute/register/action, Microsoft.ManagedIdentity/register/action, Microsoft.Storage/register/action, Microsoft.Network/register/action ne sont pas requises si ces fournisseurs sont déjà inscrits dans l’abonnement. Voir Inscrire le fournisseur de ressources.

Choix d’un type d’espace de travail

Les sections suivantes décrivent le type d’espace de travail le mieux adapté aux cas d’usage courants. Utilisez ces recommandations pour vous aider à déterminer si vous devez déployer un espace de travail serverless ou classique.

Quand choisir des espaces de travail serverless

Les espaces de travail serverless sont le meilleur choix pour les cas d’usage suivants :

  • Permettre aux utilisateurs professionnels d’accéder à Databricks One
  • Créer des tableaux de bord IA/BI
  • Créer des applications Databricks
  • Effectuer des analyses exploratoires à l’aide de notebooks ou d’entrepôts SQL
  • Se connecter à des fournisseurs SaaS via Lakehouse Federation (mais pas Lakeflow Connect)
  • Utiliser Genie Spaces pour les cas d’usage professionnels
  • Tester les nouvelles fonctionnalités d’IA de Mosaïque avant de les déplacer en production
  • Créer des pipelines déclaratifs serverless avec Spark Lakeflow

Quand choisir des espaces de travail classiques

Les espaces de travail classiques sont le meilleur choix pour les cas d’usage suivants :

  • Effectuer un travail de développement IA ou ML nécessitant des GPU
  • Utiliser Databricks Runtime pour Machine Learning ou Apache Spark MLib
  • Porter sur le code Spark hérité existant qui utilise des RDD Spark
  • Utiliser Scala ou R comme langage de codage principal
  • Transmettre des données en continu nécessitant des intervalles de déclenchements par défaut ou basés sur le temps
  • Se connecter aux API Databricks via une connexion PrivateLink
  • Se connecter directement à des systèmes locaux ou à des bases de données privées, via Lakeflow Connect

Options de création d’un espace de travail

Il existe plusieurs façons de déployer un espace de travail Azure Databricks. La méthode de déploiement standard est via le portail Azure ou Terraform.

En outre, vous pouvez créer des espaces de travail à l’aide des outils suivants :