Partilhar via


Habilitar a resiliência de zona para cargas de trabalho do Azure

Para tornar seus aplicativos mais resilientes a falhas de hardware relacionadas à zona, interrupções de rede e desastres naturais, é importante projetar suas cargas de trabalho do Azure para resiliência de zona. Ao distribuir recursos por várias zonas de disponibilidade dentro de uma região, você reduz o risco de uma única interrupção de zona afetar serviços críticos.

Embora seja uma prática recomendada abordar a resiliência da zona durante o planejamento inicial e a implantação de cargas de trabalho, é comum querer converter cargas de trabalho não resilientes existentes em configurações resilientes de zona. Em geral, o processamento de habilitar a resiliência de zona para cargas de trabalho existentes é simples, e a Microsoft continua a simplificar o processo. No entanto, qualquer alteração na sua carga de trabalho pode introduzir uma quantidade de risco. Depois de entender os riscos envolvidos, você poderá avaliar e priorizar quais cargas de trabalho e serviços dentro dessas cargas de trabalho são mais vitais para o seu negócio e, em seguida, aplicar a resiliência da zona aos recursos mais impactantes primeiro.

Este artigo descreve as principais considerações para habilitar a resiliência de zona em suas cargas de trabalho do Azure. Ele também ajuda você a planejar e implementar uma transição bem-sucedida para uma arquitetura mais resiliente.

Sugestão

Se você estiver atualmente no processo de projetar suas cargas de trabalho ou planeja fazer uma revisão de design de suas cargas de trabalho atuais, é importante seguir as recomendações para projetar redundância no Azure Well-Architected Framework (WAF). O guia de recomendações do WAF ajuda a projetar redundância de carga de trabalho em vários níveis, com foco em fluxos de trabalho críticos. Para dar suporte à adoção da zona de disponibilidade, ele também descreve estratégias como implantações em várias regiões e carimbos de implantação.

O que é resiliência de zona?

Os serviços do Azure podem tornar-se resilientes a interrupções na zona de disponibilidade de duas formas principais:

  • Serviços com redundância de zona: Muitos serviços do Azure suportam redundância de zona. Esses serviços replicam automaticamente dados entre zonas de disponibilidade, distribuem solicitações de entrada e fazem failover para zonas diferentes durante uma falha de zona. Cada serviço oferece suporte a esses recursos de uma forma que faça sentido para esse serviço específico. Alguns serviços são redundantes de zona por padrão, enquanto outros serviços podem precisar que você configure a redundância de zona.

  • Serviços zonais: Alguns serviços do Azure são zonais, o que significa que podem ser fixados a uma zona de disponibilidade específica. Para obter resiliência de zona usando um serviço zonal, implante instâncias separadas do serviço em várias zonas de disponibilidade. Também pode ser necessário gerenciar a distribuição de tráfego, a replicação de dados e o failover entre as instâncias.

Alguns serviços podem ser implantados em uma configuração com redundância de zona ou zonal. Na maioria dos casos, é melhor implantar serviços com redundância de zona quando possível.

Para obter mais informações, consulte Tipos de suporte à zona de disponibilidade.

Procedimento de habilitação de zona

Use as etapas a seguir para revisar sistematicamente suas cargas de trabalho do Azure, priorizá-las para resiliência de zona e habilitar a resiliência de zona para cada componente.

Pré-requisitos

Antes de começar, execute as seguintes ações:

  • Identifique cada carga de trabalho. Uma carga de trabalho refere-se a uma coleção de recursos de aplicativos, dados e infraestrutura de suporte que funcionam juntos para alcançar resultados de negócios definidos. Para obter mais informações sobre cargas de trabalho e como defini-las, consulte Cargas de trabalho doWell-Architected Framework.

  • Priorize os fluxos de usuário e sistema de cada carga de trabalho. Compreenda os caminhos críticos e as dependências de suas cargas de trabalho para determinar quais componentes tornar a zona resiliente primeiro. Para obter mais informações sobre como usar a análise de fluxo crítico para priorizar fluxos de trabalho, consulte Priorizar cargas de trabalho para resiliência de zona.

  • Atribua uma classificação de criticidade a cada carga de trabalho e fluxo. Essa classificação ajuda você a entender o impacto de uma possível interrupção em sua empresa e orienta suas decisões sobre quais cargas de trabalho priorizar para resiliência de zona. Considere também a quantidade de tempo de inatividade aceitável enquanto reconfigura as cargas de trabalho.

    Você pode usar uma taxonomia para classificar suas cargas de trabalho com base em sua criticidade. Esta abordagem ajuda-o a concentrar os seus esforços nos serviços mais importantes.

    Considere o exemplo de taxonomia a seguir para classificar suas cargas de trabalho.

    Tipo de carga de trabalho Description Efeito da perturbação
    Crítico para a missão Fluxos críticos e cargas de trabalho que devem ser altamente confiáveis, sempre disponíveis, resilientes a falhas e operacionais Qualquer perturbação das funções essenciais acarreta imediatamente riscos catastróficos para os negócios ou introduz riscos para a vida humana.
    Críticas para os negócios Fluxos e cargas de trabalho essenciais que operam funções de negócios importantes A interrupção corre o risco de alguma perda financeira ou danos à marca.
    Operacional de negócios Contribui para a eficiência das operações de negócios, mas fora da linha de serviço direta para os clientes Pode tolerar algum nível de perturbação.
    Administrativo Fluxos internos de produção e cargas de trabalho não alinhados às operações de negócios Pode tolerar perturbações.

    Para obter mais informações sobre como classificar suas cargas de trabalho de acordo com a classificação de criticidade, consulte Atribuir uma classificação de criticidade a cada fluxo.

  • Verifique se as regiões onde seus recursos do Azure residem oferecem suporte a zonas de disponibilidade. Consulte a lista de regiões do Azure. Se uma região não oferecer suporte a zonas de disponibilidade, considere realocar seus recursos para uma região que ofereça suporte a isso. Para obter mais informações, consulte Mover recursos do Azure entre grupos de recursos, assinaturas ou regiões.

Etapa 1: Priorizar os serviços do Azure para resiliência de zona

Depois de determinar quais fluxos de carga de trabalho são mais críticos para sua empresa, você pode se concentrar nos serviços do Azure dos quais esses fluxos dependem. Alguns serviços do Azure são mais críticos para seus aplicativos do que outros. Priorize esses serviços para ajudar a garantir que seus aplicativos permaneçam disponíveis e resilientes se ocorrer uma falha de zona.

Use as diretrizes a seguir para priorizar grupos de serviços do Azure com base em sua importância para suas cargas de trabalho. Considere sua arquitetura de aplicativo específica e seus requisitos de negócios ao determinar a prioridade dos serviços para resiliência de zona.

  1. Comece com os serviços de rede. As cargas de trabalho tendem a compartilhar serviços de rede, portanto, um aumento na resiliência desses serviços pode melhorar a resiliência de várias cargas de trabalho ao mesmo tempo.

    Muitos serviços de rede principais são automaticamente redundantes de zona, mas deve concentrar-se em componentes como Gateways ExpressRoute do Azure, Gateway de VPN do Azure, Gateway de Aplicação do Azure, Distribuidor de Carga do Azure e Firewall do Azure.

  2. Melhore a resiliência do armazenamento de dados operacionais. Os armazenamentos de dados operacionais contêm dados valiosos que várias cargas de trabalho costumam usar, portanto, melhorar a disponibilidade desses armazenamentos de dados pode ajudar muitas cargas de trabalho.

    Para resiliência de armazenamento de dados operacionais, concentre-se em serviços como Banco de Dados SQL do Azure, Instância Gerenciada SQL do Azure, Armazenamento do Azure, Armazenamento do Azure Data Lake, Azure Cosmos DB, Servidor Flexível do Azure PostgreSQL, Servidor Flexível do Azure MySQL e Cache do Azure para Redis.

  3. Priorize serviços de computação. Esses serviços geralmente são fáceis de replicar e distribuir entre zonas porque são sem estado.

    Os serviços de computação incluem Máquinas Virtuais do Azure, Conjuntos de Escala de Máquina Virtual do Azure, Serviço Kubernetes do Azure (AKS), Serviço de Aplicativo do Azure, Ambiente do Serviço de Aplicativo, Azure Functions, Azure Service Fabric e Aplicativos de Contêiner do Azure.

  4. Analise os recursos críticos de negócios restantes que seus fluxos críticos usam. Esses recursos podem não ser tão críticos quanto os recursos listados anteriormente, mas ainda desempenham um papel na funcionalidade do seu aplicativo, e você deve considerá-los para resiliência de zona.

  5. Analise o restante dos recursos operacionais da sua empresa. Tome decisões informadas sobre se deve torná-los resilientes a zonas. Essa revisão inclui serviços que podem não estar diretamente relacionados às suas cargas de trabalho críticas, mas ainda contribuem para o desempenho geral e a confiabilidade do aplicativo.

Etapa 2: Avaliar abordagens de configuração de zona

Depois de priorizar suas cargas de trabalho e serviços do Azure, identifique a abordagem necessária para habilitar o suporte à zona de disponibilidade para cada serviço e entenda o que você precisa fazer para configurar a resiliência da zona.

Cada guia de serviço de confiabilidade do Azure fornece uma seção que descreve como habilitar a resiliência de zona para esse serviço. Esta seção ajuda você a entender o esforço necessário para tornar cada zona de serviço resiliente, para que você possa planejar sua estratégia de acordo. Para obter mais informações sobre um serviço específico, consulte Guias de serviço de confiabilidade do Azure.

Use a tabela de configuração de zona para entender rapidamente as abordagens para serviços comuns do Azure.

Importante

Se sua carga de trabalho incluir componentes implantados em uma configuração zonal (ou de zona única), planeje tornar esses componentes resilientes a interrupções de zona. Uma abordagem comum é implantar instâncias separadas em outra zona de disponibilidade e alternar entre elas, se necessário.

Etapa 3: Testar a latência

Ao tornar as zonas de cargas de trabalho resilientes, considere a latência entre as zonas de disponibilidade. Ocasionalmente, alguns sistemas herdados não podem tolerar a pequena quantidade de latência extra que o tráfego entre zonas introduz, especialmente quando você habilita a replicação síncrona na camada de dados. Se você suspeitar que a latência entre zonas pode afetar sua carga de trabalho, execute testes antes e depois de habilitar a resiliência de zona. Para mais informações sobre como a latência interzonalmente pode afetar a sua aplicação e abordagens para mitigar problemas de latência interzonal, consulte Recursos Zonais e resiliência de zonas.

Abordagens de configuração de zona para serviços do Azure

Cada serviço do Azure dá suporte a um tipo específico de suporte à zona de disponibilidade, que se baseia no uso pretendido do serviço e na arquitetura interna. Se você tiver um recurso que não está configurado para usar zonas de disponibilidade (ou um recurso não zonal ), convém reconfigurá-lo com suporte à zona de disponibilidade. O guia de confiabilidade para esse serviço fornece orientação ou links para instruções de configuração da zona de disponibilidade.

Esta seção fornece uma visão geral dos diferentes tipos de abordagens de configuração de zona e qual abordagem cada serviço suporta.

Importante

Quando você habilita a redundância de zona em um recurso, esse recurso se torna automaticamente resiliente a falhas de zona. Quando você usa uma configuração zonal para fixar o recurso em uma zona de disponibilidade específica, o recurso não é automaticamente redundante de zona. Você deve torná-lo resiliente a uma falha de zona. Para serviços zonais, este artigo reflete a complexidade e o custo da fixação a uma zona. Para obter mais informações sobre etapas adicionais para alcançar a resiliência da zona, consulte o guia de confiabilidade do serviço.

A tabela de configuração de zona lista a abordagem de configuração de zona com suporte para muitos serviços do Azure e contém um link para cada guia de confiabilidade para esse serviço. O guia de confiabilidade fornece informações sobre como configurar recursos de serviço não zonal para habilitar o suporte à zona de disponibilidade.

A tabela a seguir descreve cada abordagem de configuração de zona, incluindo o nível de esforço e tempo de inatividade necessários para habilitar zonas de disponibilidade.

Abordagem Description Nível típico de esforço Pode exigir tempo de inatividade
Sempre resiliente em zonas O serviço é resiliente em relação às zonas por padrão em regiões que oferecem suporte a zonas de disponibilidade. Não é necessária qualquer ação. Nenhum Não
Habilitação Alterações mínimas de configuração necessárias, como habilitar redundância de zona nas configurações. O processo não afeta a disponibilidade, mas considera os efeitos no custo ou no desempenho. Low Não
Modificação Provavelmente requer algumas alterações de configuração, como reimplantar recursos dependentes ou modificar as configurações de rede. Médio Yes
Reafectação Alterações significativas necessárias, como a reimplantação de recursos, aplicativos ou serviços inteiros ou a migração de dados para novos serviços. High Yes

Entenda o custo de habilitar o suporte da zona de disponibilidade para um serviço. Para muitos serviços, ativar zonas de disponibilidade não aumenta o custo. Mas alguns serviços exigem um nível específico, um número específico de unidades de capacidade ou ambos. Outros serviços cobram tarifas diferentes quando você usa zonas de disponibilidade. A tabela na próxima seção lista o impacto de custo típico para cada serviço.

Observação

As informações neste artigo resumem a abordagem típica para habilitar o suporte à zona de disponibilidade e descrevem o impacto de custo típico. Mas alguns fatores podem afetar o funcionamento da sua solução específica. Por exemplo, alguns serviços são listados como sempre resilientes à zona, mas essa designação só se aplica em regiões específicas ou para camadas específicas do serviço. Use essas tabelas como ponto de partida, mas revise os outros recursos mencionados para entender os detalhes específicos.

Serviços do Azure por abordagem de configuração de zona

A tabela a seguir resume o suporte da zona de disponibilidade para muitos serviços do Azure e fornece uma abordagem, incluindo impacto nos custos, para habilitar o suporte à zona de disponibilidade para cada serviço.

Serviço Pode ter redundância de zona Pode ser zonal Abordagem típica de configuração de zona Impacto típico nos custos
Azure AI Search Sim Sempre resiliente em zonas N/A
Gestão de API do Azure Sim Sim Modificação Nível mínimo exigido
Configuração do Aplicativo do Azure Sim Sempre resiliente em zonas N/A
Serviço de Aplicações do Azure Sim Habilitação Número mínimo de níveis e instâncias necessárias
Serviço de Aplicativo do Azure - Ambiente do Serviço de Aplicativo Sim Habilitação Contagem mínima de instâncias necessária
Gateway de Aplicação do Azure Sim Sim Sempre resiliente em zonas N/A
Azure Backup Sim Reafectação Aumento moderado dos custos
Azure Bastion Sim Sim Reafectação Sem impacto nos custos
Azure Batch Sim Reafectação Sem impacto de custo para o mesmo número de máquinas virtuais (VMs)
Armazenamento de Blobs do Azure Sim Habilitação Aumento moderado dos custos
Cache do Azure para Redis - Enterprise Sim Reafectação Sem impacto nos custos
Cache do Azure para Redis - Standard e Premium Sim Habilitação Nível mínimo exigido
Aplicativos de contêiner do Azure Sim Reafectação Contagem mínima de réplicas necessária
Instâncias de contêiner do Azure Sim Reafectação Sem impacto nos custos
Azure Container Registry Sim Sempre resiliente em zonas N/A
Azure Cosmos DB para NoSQL Sim Modificação Nenhum se estiver usando autoscale ou escritas em várias regiões
Fábrica de Dados do Azure Sim Sempre resiliente em zonas N/A
Armazenamento de Dados do Azure Lake Sim Habilitação Aumento moderado dos custos
Banco de Dados do Azure para MySQL - Servidor Flexível Sim Reafectação Requer uma instância primária e uma instância de alta disponibilidade (HA)
Banco de Dados do Azure para PostgreSQL - Servidor Flexível Sim Habilitação Requer uma instância primária e uma instância de Alta Disponibilidade
Azure Databricks Sim Habilitação Sem impacto de custo para o mesmo número de VMs; aumento moderado de custos para armazenamento
Azure Disk Storage (discos gerenciados) Sim Sim Habilitação Aumento moderado dos custos
Azure Elastic SAN Sim Reafectação Aumento moderado dos custos
Hubs de Eventos do Azure: camada dedicada Sim Sempre resiliente em zonas Unidades de capacidade mínima (UCs) necessárias
Hubs de Eventos do Azure: todas as outras camadas Sim Sempre resiliente em zonas N/A
Azure ExpressRoute gateway Sim Sim Modificação Depende do nível
Ficheiros do Azure Sim Habilitação Aumento moderado dos custos
Azure Firewall Sim Sim Modificação Sem impacto nos custos
Funções do Azure Sim Reafectação Número mínimo de níveis e instâncias necessárias
Azure HDInsight Sim Reafectação Sem impacto nos custos para o mesmo número de nós
Hub IoT do Azure Sim Sempre resiliente em zonas N/A
Azure Key Vault Sim Sempre resiliente em zonas N/A
Serviço Kubernetes do Azure (AKS) Sim Reafectação Sem impacto nos custos
Balanceador de Carga do Azure Sim Sim Modificação Sem impacto nos custos
Azure Logic Apps - Camada de Consumo Sim Sempre resiliente em zonas N/A
Azure Logic Apps - Nível Standard Sim Reafectação Número mínimo de níveis e instâncias necessárias
Azure Managed Grafana Sim Voltar a implementar Aumento moderado dos custos
Azure Monitor: Análise de Logs Sim Sempre resiliente em zonas
Arquivos NetApp do Azure Sim Reafectação Depende da configuração da replicação
Armazenamento de Filas do Azure Sim Habilitação Aumento moderado dos custos
Barramento de Serviço do Azure Sim Sempre resiliente à zona N/A
Azure Service Fabric Sim Sim Reafectação Sem impacto nos custos para o mesmo número de VMs
Azure Site Recovery Sim Reafectação Sem impacto nos custos da recuperação de locais, aumento moderado dos custos do armazenamento de réplicas
Banco de Dados SQL do Azure: camada crítica para os negócios Sim Habilitação Sem impacto nos custos
Banco de Dados SQL do Azure: camada de uso geral Sim Habilitação Aumento moderado dos custos
Banco de Dados SQL do Azure: camada de hiperescala Sim Reafectação Contagem mínima de réplicas necessária
Banco de Dados SQL do Azure: camada Premium Sim Habilitação Sem impacto nos custos
Instância Gerenciada SQL do Azure Sim Habilitação Aumento moderado dos custos
Armazenamento de Tabela do Azure Sim Habilitação Aumento moderado dos custos
Conjuntos de Dimensionamento de Máquinas Virtuais do Azure Sim Sim Reafectação Sem impacto nos custos para o mesmo número de VMs
Máquinas Virtuais do Azure Sim Reafectação Sem impacto nos custos para o mesmo número de VMs
Rede Virtual do Azure Sim Sempre resiliente em zonas N/A
Endereço IP público Sim Sim Sempre resiliente em zonas N/A