Compartilhar via


Usar a computação de GPU sem servidor no Microsoft Dev Box

Este artigo explica o que é a computação de GPU sem servidor, como ela funciona e os principais cenários para seu uso. A computação de GPU sem servidor no Microsoft Dev Box (versão prévia) permite que você crie caixas de desenvolvimento com aceleração de GPU, sem necessidade de instalação extra. A computação de GPU sem servidor do Dev Box permite que os desenvolvedores usem recursos de GPU sob demanda sem infraestrutura permanente ou configuração complexa.

Cenários comuns para computação de GPU sem servidor incluem cargas de trabalho com uso intensivo de computação, como treinamento de modelo de IA, inferência e processamento de dados. A computação de GPU sem servidor permite:

  • Usar recursos de GPU somente quando precisar deles
  • Dimensionar recursos de GPU com base nas demandas de carga de trabalho
  • Pagar somente pelo tempo de GPU que você usa
  • Trabalhar no ambiente de rede seguro da sua organização

Essa funcionalidade integra o Microsoft Dev Box aos Aplicativos de Contêiner do Azure para fornecer energia de GPU sem exigir que os desenvolvedores gerenciem a infraestrutura.

A computação de GPU sem servidor no Dev Box usa os Aplicativos de Contêiner do Azure (ACA). Quando um desenvolvedor inicia um shell ou uma ferramenta habilitada para GPU, o Computador de Desenvolvimento automaticamente:

  • Cria uma conexão com uma sessão de GPU sem servidor
  • Provisiona os recursos de GPU necessários
  • Disponibiliza esses recursos por meio do terminal do desenvolvedor ou do ambiente de desenvolvimento integrado
  • Encerra automaticamente a sessão quando não for mais necessário

Prerequisites

  • Uma assinatura do Azure
  • Microsoft.App registrado para sua assinatura
  • Microsoft.CognitiveServices registrado para sua assinatura
  • Um centro de desenvolvimento e um projeto
  • Uma MSI (identidade de serviço gerenciada) configurada para o centro de desenvolvimento

Configurar a GPU sem servidor

Os administradores controlam o acesso à GPU sem servidor no nível do projeto por meio do Centro de Desenvolvimento. Os principais recursos de gerenciamento incluem:

  • Habilitar/desabilitar o acesso à GPU: controlar se os projetos podem usar recursos de GPU sem servidor.
  • Definir limites de GPU simultâneos: defina o número máximo de GPUs que podem ser usadas ao mesmo tempo em um projeto.

O acesso aos recursos de GPU sem servidor é gerenciado por meio de propriedades no nível do projeto. Quando o recurso de GPU sem servidor está habilitado para um projeto, todas as Caixas de Desenvolvimento nesse projeto podem usar a computação de GPU. Esse modelo de acesso simples remove a necessidade de funções personalizadas ou configurações baseadas em pool.

Important

A GPU sem servidor está disponível apenas em regiões específicas. Seu projeto deve estar em uma das seguintes regiões: BrazilSouth, CanadaCentral, CentralUS, EastUS, EastUS2, SouthCentralUS ou WestUS3.

Registrar GPU sem servidor para a assinatura

  1. Entre no portal do Azure.
  2. Navegue até sua assinatura.
  3. Selecioneos recursos de Visualização de >.
  4. Selecione Dev Box Serverless GPU Preview e, em seguida, selecione Registrar. Captura de tela da página de assinatura do Azure mostrando o recurso Dev Box Serverless GPU Preview.

Habilitar a GPU sem servidor para um projeto

  1. Vá para o seu projeto.
  2. Selecione Configurações>Configurações da caixa Dev.
  3. Em cargas de trabalho de IA, selecione Habilitar e selecione Aplicar. Captura de tela da página de configurações da caixa de desenvolvimento, mostrando a opção GPU sem servidor habilitada.

Conectar-se a uma GPU

Depois de habilitar a GPU sem servidor, os usuários do Dev Box nesse projeto verão as opções de GPU em seus ambientes de código do terminal e do Visual Studio (VS).

Você pode se conectar usando um destes métodos:

Método 1: iniciar um shell de GPU do Dev Box

  1. Abra o Terminal do Windows na caixa de desenvolvimento.
  2. Execute o seguinte comando:
    devbox gpu shell
    
  3. Conecta você a um contêiner de GPU pré-configurado.

Método 2: Usar o VS Code com túneis remotos

  1. Abra o Terminal do Windows na caixa de desenvolvimento.
  2. Execute o seguinte comando:
    devbox gpu shell
    
  3. Inicie o Visual Studio Code.
  4. Instale a extensão de Túneis Remotos.
  5. Conecte-se ao túnel gpu-session.