Partilhar via


Solução de problemas com o código de erro ZonalAllocationFailed, AllocationFailed ou OverconstrainedAllocationRequest

Este artigo descreve como identificar e resolver o ZonalAllocationFailed, AllocationFailed ou OverconstrainedAllocationRequest erro que pode ocorrer quando você tenta criar, implantar ou atualizar um cluster do Serviço de Kubernetes do Azure (AKS).

Pré-requisitos

  • CLI do Azure (opcional), versão 2.0.59 ou uma versão posterior. Se a CLI do Azure já estiver instalada, você poderá encontrar o número de versão usando az --version.

  • Azure PowerShell (opcional).

Sintomas

Ao tentar criar um cluster do AKS, você recebe a seguinte mensagem de erro:

Reconciliar erro do pool de agentes VMSS: Falha ao tentar novamente o VMSSAgentPoolReconciler:

Categoria: Erro Interno

Subcódigo: ZonalAllocationFailed;

Dependência: Microsoft.Compute/VirtualMachineScaleSet;

CodigoDeErroOriginal: Código="AlocaçãoDeZonaFalhou"

Message="Falha na alocação. Não temos capacidade suficiente para o tamanho da VM solicitada nesta zona. Leia mais sobre como melhorar a probabilidade de sucesso de alocação em https://aka.ms/allocation-guidance";

AKSTeam: NodeProvisioning

Ou, ao tentar atualizar ou escalar verticalmente um cluster, você recebe a seguinte mensagem de erro:

Code="SolicitaçãoDeAlocaçãoExcessivamenteRestrita"

Message="Falha na alocação. As VMs com as seguintes restrições não podem ser alocadas, pois a condição é muito restritiva. Remova algumas restrições e tente novamente."

Ou, quando você usa hosts dedicados em um cluster e tenta criar ou escalar um pool de nós, recebe a seguinte mensagem de erro:

Code="FalhaDeAlocação"

Message="Falha na alocação. Falha na alocação de VM para o host dedicado. Verifique se o host dedicado tem capacidade suficiente ou tente alocar em outro lugar."

Causa 1: disponibilidade de zona limitada em um SKU

Você está tentando implantar, atualizar ou escalar verticalmente um cluster em uma zona que tem disponibilidade limitada para o SKU específico.

Solução 1: usar um SKU, uma zona ou uma região diferente

Experimente um ou mais dos seguintes métodos:

  • Reimplante o cluster na mesma região usando um SKU diferente.
  • Reimplante o cluster em uma zona diferente nessa região.
  • Reimplante o cluster em uma região diferente.
  • Crie um novo pool de nós em uma zona diferente ou use um SKU diferente.

Para obter mais informações sobre como corrigir esse erro, consulte Resolver erros de SKU não disponíveis.

Causa 2: Muitas restrições para serem acomodadas por uma máquina virtual

Se você receber um OverconstrainedAllocationRequest código de erro, a plataforma de Computação do Azure não poderá alocar uma nova VM (máquina virtual) para acomodar as restrições necessárias. Essas restrições geralmente (mas nem sempre) incluem os seguintes itens:

  • Tamanho da VM
  • SKU da VM
  • Redes aceleradas
  • Zona de disponibilidade
  • Disco efêmero
  • Grupo de posicionamento por proximidade (PPG)

Solução 2: Não associar um grupo de posicionamento por proximidade ao pool de nós

Se você receber um erro de código OverconstrainedAllocationRequest, tente criar um novo pool de nós que não esteja associado a um grupo de localização por proximidade.

Causa 3: Não há hosts dedicados suficientes ou domínios de falha

Você está tentando implantar um pool de nós em um grupo de hosts dedicado, que tem capacidade limitada ou não atende à restrição de domínio de falha.

Solução 3: verifique se você tem hosts dedicados suficientes para seus nós do AKS/VMSS

De acordo com o planejamento da capacidade de ADH no AKS, você é responsável por planejar hosts dedicados suficientes para abranger quantos domínios de falha forem exigidos pelo seu VMSS do AKS. Por exemplo, se o AKS VMSS for criado com FaultDomainCount=2, você precisará de pelo menos dois hosts dedicados em domínios de falha diferentes (FaultDomain 0 e FaultDomain 1).

Mais informações

Garantir a capacidade dos usuários é uma prioridade máxima para a Microsoft e estamos trabalhando 24 horas por dia para atingir essa meta. A crescente popularidade dos serviços do Azure enfatiza a necessidade de expandir nossa infraestrutura ainda mais rapidamente. Com isso em mente, estamos agilizando expansões e melhorando nosso processo de implantação de recursos para responder à forte demanda do cliente. Também estamos adicionando uma grande quantidade de infraestrutura de computação mensalmente.

Identificamos vários métodos para melhorar a forma como balanceamos a carga em uma situação de alto uso de recursos e como acionar a implantação oportuna dos recursos necessários. Além disso, estamos aumentando significativamente nossa capacidade e continuaremos a planejar uma forte demanda em todas as regiões. Para obter mais informações sobre as melhorias que estamos fazendo para fornecer uma cadeia de fornecimento de nuvem resiliente, consulte Avançar a confiabilidade por meio de uma cadeia de fornecimento de nuvem resiliente.

Referências

Entre em contato conosco para obter ajuda

Se você tiver dúvidas, poderá perguntar ao suporte da comunidade do Azure. Você também pode enviar comentários sobre o produto para a comunidade de comentários do Azure.