Partager via


Utiliser le calcul GPU serverless dans Microsoft Dev Box

Cet article explique ce que le calcul GPU serverless est, comment il fonctionne et les scénarios clés pour son utilisation. Le calcul GPU serverless dans Microsoft Dev Box (préversion) vous permet de lancer des boîtes de développement avec accélération GPU, sans configuration supplémentaire. Le calcul GPU serverless Dev Box permet aux développeurs d’utiliser des ressources GPU à la demande sans configuration permanente ou complexe.

Les scénarios courants de calcul GPU serverless incluent des charges de travail gourmandes en calcul, telles que l’entraînement, l’inférence et le traitement des données du modèle IA. Le calcul GPU serverless vous permet de :

  • Utilisez des ressources GPU uniquement quand vous en avez besoin
  • Mettre à l’échelle les ressources GPU en fonction des demandes de charge de travail
  • Payer uniquement pour le temps GPU que vous utilisez
  • Travailler dans l’environnement réseau sécurisé de votre organisation

Cette fonctionnalité intègre Microsoft Dev Box à Azure Container Apps pour fournir de l’alimentation GPU sans nécessiter que les développeurs gèrent l’infrastructure.

Le calcul GPU serverless dans Dev Box utilise Azure Container Apps (ACA). Lorsqu’un développeur démarre un interpréteur de commandes ou un outil compatible GPU, Dev Box fonctionne automatiquement ainsi :

  • Crée une connexion à une session GPU serverless
  • Provisionne les ressources GPU nécessaires
  • Rend ces ressources disponibles via le terminal du développeur ou l’environnement de développement intégré
  • Met automatiquement fin à la session lorsqu’elle n’est plus nécessaire

Prerequisites

  • Un abonnement Azure
  • Microsoft.App enregistrée pour votre abonnement
  • Microsoft.CognitiveServices enregistré pour votre abonnement
  • Centre de développement et projet
  • Une identité de service managé (MSI) configurée pour le centre de développement

Configurer le GPU sans serveur

Les administrateurs contrôlent l’accès GPU serverless au niveau du projet via le Centre de développement. Les fonctionnalités de gestion des clés sont les suivantes :

  • Activer/désactiver l’accès GPU : contrôler si les projets peuvent utiliser des ressources GPU serverless.
  • Définir des limites de GPU simultanées : définissez le nombre maximal de GPU qui peuvent être utilisés en même temps dans un projet.

L’accès aux ressources GPU serverless est géré via des propriétés au niveau du projet. Lorsque la fonctionnalité GPU serverless est activée pour un projet, toutes les zones de développement de ce projet peuvent utiliser le calcul GPU. Ce modèle d’accès simple supprime la nécessité de rôles personnalisés ou de configurations basées sur un pool.

Important

Le GPU serverless est disponible uniquement dans des régions spécifiques. Votre projet doit se trouver dans l’une des régions suivantes : BrésilSouth, CanadaCentral, CentralUS, EastUS, EastUS2, SouthCentralUS ou WestUS3.

Inscrire un GPU serverless pour l’abonnement

  1. Connectez-vous au portail Azure.
  2. Naviguez vers votre abonnement.
  3. Sélectionnez Paramètres>Fonctionnalités d’aperçu.
  4. Sélectionnez Dev Box Serverless GPU Preview, puis sélectionnez Inscrire. Capture d’écran de la page d’abonnement Azure montrant la fonctionnalité de préversion du GPU Serverless Dev Box.

Activer le GPU serverless pour un projet

  1. Accédez à votre projet.
  2. Sélectionnez Paramètres>Paramètres dev box.
  3. Sous charges de travail IA, sélectionnez Activer, puis sélectionnez Appliquer. Capture d’écran de la page paramètres de la zone de développement montrant l’option GPU serverless activée.

Se connecter à un GPU

Après avoir activé le GPU serverless, les utilisateurs dev Box de ce projet voient les options GPU dans leur terminal et leurs environnements Visual Studio (VS) Code.

Vous pouvez vous connecter à l’aide de l’une des méthodes suivantes :

Méthode 1 : Lancer un interpréteur de commandes GPU Dev Box

  1. Ouvrez le terminal Windows dans votre zone de développement.
  2. Exécutez la commande suivante :
    devbox gpu shell
    
  3. Vous connecte à un conteneur GPU préconfiguré.

Méthode 2 : Utiliser VS Code avec des tunnels distants

  1. Ouvrez le terminal Windows dans votre zone de développement.
  2. Exécutez la commande suivante :
    devbox gpu shell
    
  3. Lancez Visual Studio Code.
  4. Installer l’extension Tunnels à distance.
  5. Connectez-vous au tunnel gpu-session.