Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Um perfil de carga de trabalho determina o tipo e a quantidade de recursos de computação e memória disponíveis para aplicações container implementadas num ambiente Azure Container Apps. Pode configurar diferentes perfis para se adequar às diferentes necessidades das suas aplicações.
Tipos de perfil
O Azure Container Apps suporta três tipos de perfis de carga de trabalho: Consumo, Dedicado e Flex.
Cada tipo de perfil determina como as suas aplicações escalam, o nível de isolamento de recursos e como é cobrado.
Os perfis de consumo utilizam uma arquitetura serverless. As aplicações neste perfil escalam automaticamente a pedido e, opcionalmente, escalam para zero quando estão inativas. Paga apenas pelos recursos que as suas aplicações em execução utilizam. A faturação orientada para sem servidor também se aplica a GPUs sem servidor para cargas de trabalho especializadas. Como paga apenas pelos recursos que as suas aplicações utilizam, o perfil de Consumo é adequado para aplicações que experienciam grandes surtos de pedidos ou cenários em que o nível das cargas de trabalho é imprevisível.
Perfis dedicados correm em recursos de computação reservados no seu próprio pool dedicado. Seleciona o tamanho e o tipo da máquina virtual, implementa várias aplicações por perfil e paga por instância de perfil. Perfis dedicados podem ser mais económicos para cargas de trabalho estáveis e suportar casos de uso geral, otimizados para memória e GPU.
O perfil flexível (pré-visualização) combina a simplicidade de faturação e configuração do perfil de Consumo com muitas das características de desempenho dos perfis dedicados. Perfis flexíveis são faturados como um perfil de Consumo mais a taxa de gestão dedicada, executados num pool de computação de inquilino único, oferecem janelas de manutenção planeada, redes dedicadas e acesso a réplicas de tamanhos maiores. Perfis flexíveis requerem uma sub-rede de pelo menos
/25.
Cada ambiente Container Apps inclui um perfil de Consumo predefinido. Pode adicionar perfis de GPU Dedicados ou de Consumo e, quando disponíveis, perfis Flexíveis para satisfazer as necessidades da sua aplicação.
Nota
O perfil Flexible está atualmente disponível apenas nas seguintes regiões: EUA Central EUAP, EUA Leste EUA 2, Leste da Ásia e Centro Oeste dos EUA.
Fatores de forma dos perfis de carga de trabalho
Diferentes tipos de perfis de carga de trabalho oferecem diferentes fatores de forma como propósito geral, otimizado para memória, GPU ou integrado.
| Tipo de perfil | Fatores de forma | Descrição | Utilização potencial |
|---|---|---|---|
| Consumo | Fins gerais | Adicionado automaticamente a novos ambientes e executado numa infraestrutura sem servidor de consumo. | Aplicações que não requerem requisitos de hardware específicos. |
| Consumo | GPU | GPUs sem servidor redimensionáveis até zero estão disponíveis em regiões como o Oeste dos EUA, a Austrália Oriental e o Centro da Suécia. Para ver a lista completa das regiões disponíveis, consulte regiões suportadas por GPU serverless | Aplicações que exigem aceleração da GPU. |
| Dedicado | Fins gerais | Perfis com equilíbrio entre CPU e recursos de memória. | Aplicações que exigem maiores quantidades de CPU ou memória. |
| Dedicado | Com otimização de memória | Perfis com recursos de memória aumentados para dados em memória ou modelos de aprendizagem automática. | Aplicações com requisitos elevados de memória. |
| Dedicado | GPU | Perfis com computação habilitada por GPU estão disponíveis apenas em regiões selecionadas. Perfis dedicados com GPU devem ser configurados ao criar um ambiente. | Aplicações que exigem aceleração da GPU e hardware dedicado. |
Nota
Ao usar perfis com GPU, certifique-se de que a sua aplicação executa a versão mais recente do CUDA.
Detalhes do perfil
As tabelas seguintes resumem os perfis de carga de trabalho disponíveis por tipo de perfil, agrupando tamanhos semelhantes para o ajudar a decidir qual a opção mais adequada para si. Os campos vCPU e memória mostram a variedade de recursos entre os tamanhos de perfis.
Detalhes do perfil de consumo
| Nomes de perfil | Gama vCPU | Intervalo de memória | Tipo de GPU | Regiões | Alocação |
|---|---|---|---|---|---|
| Consumo | 0.25-4 | 0,5-8 GiB | Todas as regiões suportadas | por réplica | |
| Consumo-GPU-NC24-A100, Consumo-GPU-NC8AS-T4 | 8–24 | 56–220 GiB | NVIDIA T4, A100 | Para ver a lista completa das regiões disponíveis, consulte regiões suportadas por GPU serverless | por réplica |
Todos os perfis de Consumo suportam a escalabilidade serverless e o faturamento é feito com base na utilização por réplica.
Detalhes do perfil dedicado
| Classification | Nomes de perfil | Gama vCPU | Intervalo de memória | Tipo de GPU | Regiões | Alocação |
|---|---|---|---|---|---|---|
| Fins Gerais | D4, D8, D16, D32 | 4–32 | 16–128 GiB | Nenhum | Todas as regiões suportadas | por nó |
| Otimizado para Memória | E4, E8, E16, E32 | 4–32 | 32–256 GiB | Nenhum | Todas as regiões suportadas | por nó |
| Computação Confidencial | DC4, DC8, DC16, DC32, DC48, DC64, DC96 | 4-96 | 16-384 GiB | Nenhum | UAENorth | por nó |
| GPU | NC24-A100, NC48-A100, NC96-A100 | 24–96 | 220–880 GiB | A100 | Oeste da US 3, Norte da Europa | por nó |
Nota
Perfis dedicados com GPU alocam capacidade numa base caso a caso. Deve submeter um pedido de suporte para solicitar a capacidade necessária.
Detalhes flexíveis do perfil (versão preliminar)
| Nomes de perfil | Gama vCPU | Intervalo de memória | Regiões | Alocação |
|---|---|---|---|---|
| Flexível | 0.25-4 | 0,5-16 GiB | Centro dos EUA (EUAP), Leste dos EUA 2 (EUAP), Leste Asiático, Oeste Central dos EUA | por réplica |
Consumo de recursos e escalabilidade
Podes limitar o uso de memória e CPU de cada aplicação dentro de um perfil de carga de trabalho. Como várias aplicações podem partilhar uma única instância de perfil, poderá ser necessário ajustar as definições de memória do perfil para garantir recursos adequados para todas as aplicações.
Tenha em mente que os recursos totais disponíveis para as suas aplicações são ligeiramente inferiores à alocação do perfil, pois o tempo de execução reserva alguns recursos computacionais. Quando a procura aumenta para além dos recursos atuais, o sistema adiciona automaticamente mais instâncias de perfil. À medida que a procura diminui, o sistema elimina instâncias. Podes controlar a escalabilidade definindo o número mínimo e máximo de instâncias. A faturação baseia-se no número de instâncias de perfil em execução.
Rede
Ambientes de perfil de carga de trabalho expõem funcionalidades adicionais de rede, como rotas definidas pelo utilizador, ao tráfego seguro de entrada e saída. Consulte a documentação de redes para mais detalhes.