Compartilhar via


Monitoramento do status da integridade de Alta Disponibilidade (HA) para o Banco de Dados do Azure para PostgreSQL

O Banco de Dados do Azure para PostgreSQL – Servidor Flexível inclui um recurso de Monitoramento do Status da Integridade de HA (alta disponibilidade), que usa a estrutura da RHC (Verificação do Resource Health) do Azure. Este serviço fornece insights contínuos sobre a integridade das instâncias com HA habilitado, notificando você sobre eventos que podem afetar a conectividade e a disponibilidade. Os detalhes a seguir descrevem cada estado de integridade e os cenários associados para ajudar você a resolver problemas e manter a estabilidade do HA.

Estados de integridade

Cada estado de HA é monitorado por meio de vários sinais internos que representam condições específicas. Abaixo estão os possíveis estados de HA, juntamente com indicadores visuais e cenários que podem afetar seu servidor flexível do Banco de Dados do Azure para PostgreSQL.

Pronto – A alta disponibilidade está Íntegra

O status Pronto indica que o servidor habilitado para HA está operando normalmente sem problemas detectados que afetam a preparação para failover. Todas as configurações necessárias estão intactas e nenhuma condição de erro significativa foi detectada.

Captura de tela mostrando o status pronto para HA.

Degradado – Grupo de Segurança de Rede (NSG) ou Solução de Virtualização Bloqueando Conexões

O status Degradado pode aparecer quando regras de NSG ou uma solução de virtualização estão bloqueando conexões essenciais necessárias para alta disponibilidade. Este problema de configuração impede a funcionalidade completa do HA e deve ser corrigido ajustando as configurações do NSG.

Captura de tela mostrando o status HA Degradado devido ao bloqueio de conexões pelo NSG.

Degradado – Estado Somente Leitura

Se o PostgreSQL servidor flexível entrar em estado de somente leitura, o status Degradado refletirá essa restrição. Isso geralmente requer o provisionamento de recursos adicionais ou o endereçamento das condições que levaram à configuração de somente leitura para restaurar a funcionalidade completa.

Captura de tela mostrando o status HA Degradado devido ao estado de somente leitura.

Degradado – Alta Disponibilidade em Estado Degradado

Quando o próprio serviço de HA está com desempenho degradado, possivelmente devido a problemas transitórios ou condições em nível de sistema, este status aparece. A implementação de lógica de repetição pode ajudar a mitigar os efeitos dessas interrupções temporárias de conectividade. É importante observar que o status "degradado" não significa que o servidor está indisponível. Em vez disso, indica que a configuração geral de alta disponibilidade e as verificações de integridade ainda não foram totalmente concluídas. Apesar desse status, o servidor ainda pode estar operacional e acessível.

Para monitorar com precisão a disponibilidade do banco de dados durante esses períodos, recomendamos usar a métrica "is_db_alive" como parte das Métricas de Disponibilidade do Banco de Dados. Essa métrica fornece um indicador confiável da disponibilidade do banco de dados, ajudando você a distinguir entre uma configuração de HA incompleta temporária e um tempo de inatividade real.

Captura de tela mostrando o status HA Degradado devido a problemas de desempenho.

Degradado – Recuperação Planejada Iniciada

Durante um evento de recuperação planejada iniciado para o seu servidor, o status Degradado aparece, indicando que os processos de failover do HA estão ativos. Este é geralmente um processo breve e controlado, e o serviço deve ser retomado em breve.

Captura de tela mostrando o status HA Degradado devido a recuperação planejada.

Degradado – Failover Não Planejado Iniciado

Para um failover não planejado, este status indica um evento de failover ativo disparado por circunstâncias inesperadas. Este cenário pode envolver breves interrupções de conectividade até que o servidor conclua os procedimentos de failover.

Captura de tela mostrando o status HA Degradado devido ao failover não planejado.

Degradado – Failover de Atualização Iniciado

Durante atualizações do sistema, seu servidor HA pode passar por um failover de atualização para aplicar as atualizações necessárias. Enquanto estiver neste estado, o servidor pode restringir novas conexões temporariamente, e a lógica de repetição deve ser implementada para lidar com problemas transitórios de forma eficaz.

Captura de tela mostrando o status HA Degradado devido ao failover de atualização.

Configurando Alertas do Resource Health

Você pode configurar alertas do Resource Health para receber notificações em tempo real quando ocorrerem alterações no status de integridade da sua instância do PostgreSQL com HA habilitado. As configurações estão disponíveis através do portal do Azure ou usando um modelo do ARM, ajudando você a se manter informado sobre as atualizações de status do HA sem monitorar ativamente o portal.

Etapas para Configurar Alertas do Resource Health via Portal

  1. Navegue até o portal do Azure e selecione o servidor flexível do PostgreSQL.
  2. No menu à esquerda, selecione "Alertas" na seção "Monitoramento".
  3. Selecione "Nova regra de alerta" e configure a lógica de alerta com base nos sinais do Resource Health.
  4. Configure o grupo de ações para especificar como você deseja ser notificado (email, SMS, etc.).
  5. Analise e crie a regra de alerta.

Etapas para Criar Alertas do Resource Health usando Modelo do ARM

  1. Baixe o modelo do ARM do Guia de Modelo do ARM de Alertas do Resource Health.
  2. Personalize o modelo com os detalhes específicos do seu servidor e preferências de alerta.
  3. Implante o modelo do ARM usando a CLI do Azure ou o Azure PowerShell.
  4. Verifique a implantação e certifique-se de que os alertas estejam ativos.

Para mais detalhes sobre como configurar alertas, siga estes guias:

Ao usar o Monitoramento de Status da Integridade de HA, você obtém insights essenciais sobre o desempenho de HA do seu servidor PostgreSQL, habilitando uma abordagem proativa para gerenciar tempo de atividade e disponibilidade.