Compartilhar via


Perfis de carga de trabalho em Aplicativos de Contêiner do Azure

Um perfil de carga de trabalho determina o tipo e a quantidade de recursos de computação e memória disponíveis para aplicativos de contêiner implantados em um ambiente de Aplicativos de Contêiner do Azure. Você pode configurar perfis diferentes para atender às diferentes necessidades de seus aplicativos.

Tipos de perfil

Os Aplicativos de Contêiner do Azure dão suporte a três tipos de perfil de carga de trabalho: Consumo, Dedicado e Flex.

Cada tipo de perfil determina como seus aplicativos são dimensionados, o nível de isolamento de recursos e como você é cobrado.

  • Os perfis de consumo usam uma arquitetura sem servidor. Os aplicativos neste perfil são dimensionados automaticamente conforme a demanda e, opcionalmente, podem ser reduzidos a zero quando ociosos. Você paga apenas pelos recursos que seus aplicativos em execução usam. A cobrança orientada a ambientes sem servidor também se aplica a GPUs sem servidor para cargas de trabalho especializadas. Como você paga apenas pelos recursos que seus aplicativos usam, o perfil de Consumo é adequado para aplicativos que experimentam grandes intermitências de solicitações ou cenários em que o nível de cargas de trabalho é imprevisível.

  • Perfis dedicados são executados em recursos de computação reservados em seu próprio pool dedicado. Você seleciona o tamanho e o tipo de máquina virtual, implanta vários aplicativos por perfil e paga por instância de perfil. Perfis dedicados podem ser mais econômicos para cargas de trabalho estáveis e dar suporte a casos de uso de propósito geral, otimizados para memória, e de GPU.

  • O perfil flexível (versão prévia) combina a cobrança e a simplicidade de configuração do perfil consumo com muitas das características de desempenho dos perfis dedicados. Os perfis flexíveis são cobrados como um perfil de consumo, acrescidos da taxa de gerenciamento dedicada, são executados em um pool de computação de locatário único, oferecem janelas de manutenção planejadas, sistema de rede dedicado e acesso a tamanhos de réplica maiores. Perfis flexíveis exigem uma sub-rede de pelo menos /25.

Cada ambiente de Aplicativos de Contêiner inclui um perfil de Consumo padrão. Você pode adicionar perfis de GPU dedicados ou de consumo e, quando disponíveis, perfis flexíveis para atender às necessidades do aplicativo.

Observação

Atualmente, o perfil flexível só está disponível nas seguintes regiões: EUAP Central dos EUA, Leste dos EUA2 EUAP, Leste da Ásia e Centro-Oeste dos EUA.

Fatores de forma do perfil de carga de trabalho

Diferentes tipos de perfil de carga de trabalho oferecem diferentes fatores forma, como uso geral, otimizado para memória, GPU ou mesclado.

Tipo de perfil Fatores forma Descrição Uso potencial
Consumo Propósito geral Adicionado automaticamente a novos ambientes e executado na infraestrutura de Consumo sem servidor. Aplicativos que não exigem requisitos de hardware específicos.
Consumo GPU GPUs sem servidor de escala a zero estão disponíveis em regiões como Oeste dos EUA, Leste da Austrália e Suécia Central. Para ver uma lista completa das regiões disponíveis, consulte as regiões com suporte para GPU sem servidor Aplicativos que exigem aceleração de GPU.
Dedicado Propósito geral Perfis com um equilíbrio de recursos de CPU e memória. Aplicativos que exigem quantidades maiores de CPU ou memória.
Dedicado Otimizado para memória Perfis com recursos de memória aumentados para dados na memória ou modelos de machine learning. Aplicativos com altos requisitos de memória.
Dedicado GPU Perfis com computação habilitada para GPU estão disponíveis apenas em regiões selecionadas. Perfis dedicados habilitados para GPU devem ser configurados ao criar um ambiente. Aplicativos que exigem aceleração de GPU e hardware dedicado.

Observação

Ao usar perfis habilitados para GPU, verifique se o aplicativo executa a versão mais recente do CUDA.

Detalhes do perfil

As tabelas a seguir resumem os perfis de carga de trabalho disponíveis por tipo de perfil, agrupando tamanhos semelhantes para ajudá-lo a decidir qual opção é melhor para você. Os campos vCPU e memória mostram o intervalo de recursos entre tamanhos de perfil.

Detalhes do perfil de consumo

Nomes de perfil Intervalo de vCPU Intervalo de memória Tipo de GPU Regions Alocação
Consumo 0.25-4 0,5-8 GiB Todas as regiões com suporte por réplica
Consumo-GPU-NC24-A100, Consumo-GPU-NC8as-T4 8–24 56 a 220 GiB NVIDIA T4, A100 Para ver uma lista completa das regiões disponíveis, consulte as regiões com suporte para GPU sem servidor por réplica

Todos os perfis de Consumo dão suporte ao dimensionamento sem servidor e são cobrados com base no uso por réplica.

Detalhes do perfil dedicado

Classification Nomes de perfil Intervalo de vCPU Intervalo de memória Tipo de GPU Regions Alocação
Uso Geral D4, D8, D16, D32 4–32 16 a 128 GiB None Todas as regiões com suporte por nó
Otimizado para Memória E4, E8, E16, E32 4–32 32 a 256 GiB None Todas as regiões com suporte por nó
Computação Confidencial DC4, DC8, DC16, DC32, DC48, DC64, DC96 4-96 16-384 GiB None UaeNorth por nó
GPU NC24-A100, NC48-A100, NC96-A100 24–96 220–880 GiB A100 Oeste dos EUA 3, Norte da Europa por nó

Observação

Perfis dedicados com suporte a GPU alocam capacidade de forma individualizada. Você deve enviar um tíquete de suporte para solicitar a capacidade necessária.

Detalhes flexíveis do perfil (pré-visualização)

Nomes de perfil Intervalo de vCPU Intervalo de memória Regions Alocação
Flexível 0.25-4 0,5-16 GiB EUA Central (EUAP), Leste dos EUA2 (EUAP), Leste da Ásia, Centro-Oeste dos EUA por réplica

Consumo e dimensionamento de recursos

Você pode limitar o uso de memória e CPU para cada aplicativo em um perfil de carga de trabalho. Como vários aplicativos podem compartilhar uma única instância de perfil, talvez seja necessário ajustar as configurações de memória do perfil para garantir recursos adequados para todos os aplicativos.

Tenha em mente que o total de recursos disponíveis para seus aplicativos é um pouco menor do que a alocação do perfil, pois o tempo de execução reserva alguns recursos de computação. Quando a demanda aumenta além dos recursos atuais, o sistema adiciona automaticamente mais instâncias de perfil. À medida que a demanda diminui, o sistema remove instâncias. Você pode controlar o dimensionamento definindo contagens mínimas e máximas de instâncias. A cobrança é baseada no número de instâncias de perfil em execução.

Rede

Ambientes de perfil de carga de trabalho expõem recursos extras de rede, como rotas definidas pelo usuário, para proteger o tráfego de entrada e saída. Consulte a documentação de rede para obter detalhes.

Próximas etapas