Compartilhar via


Considerações de monitoramento para cargas de trabalho da Solução VMware no Azure

Este artigo discute a área de design de monitoramento de uma carga de trabalho da Solução VMware no Azure. Essa área se concentra nas práticas recomendadas de observabilidade. A orientação destina-se a uma equipe de operações. Microsoft, VMware e terceiros fornecem várias ferramentas que você pode usar para monitorar sua infraestrutura e aplicativo. Este artigo lista essas opções.

Cada opção oferece soluções de monitoramento com diferentes graus de custos de licenciamento, opções de integração, escopo de monitoramento e suporte. Examine cuidadosamente os termos e condições aplicáveis antes de usar as ferramentas.

Coletar dados de infraestrutura

Impacto: Excelência operacional

O monitoramento da carga de trabalho envolve a coleta de dados da infraestrutura da Solução VMware no Azure e vários componentes da solução VMware. A Solução VMware no Azure é integrada ao SDDC (datacenter definido por software) do VMware, que executa vários componentes nativos da solução VMware, como o VMware Aria. Você pode usar esse conjunto de ferramentas, incluindo o VMware Aria Operations, para gerenciar vários aspectos de sua infraestrutura.  

Outra ferramenta à sua disposição é o Status de Integridade do VMware vSphere para a Solução VMware no Azure. Essa ferramenta ajuda a garantir que a detecção e a correção proativas de problemas sejam executadas continuamente em seu ambiente de Solução VMware no Azure. Em particular, essa ferramenta encontra configurações incorretas na infraestrutura VMware vSphere e detecta gargalos de desempenho. Ele também fornece insights sobre a utilização de recursos e o desempenho geral da saúde ambiental.

O VMware Aria Operations for Networks ajuda você a obter visibilidade de rede abrangente, simplificar processos de solução de problemas e otimizar o desempenho da rede.

Recommendations
  • Configure o Status de Integridade do VMware vSphere para obter uma visão geral do status de integridade da nuvem privada da Solução Azure VMware.
  • Use ferramentas de terceiros, como o VMware Aria Suite , para maior visibilidade e análise da infraestrutura de rede de nuvem privada da Solução VMware no Azure.
  • Use ferramentas de monitoramento nativas do Azure, como:
    • Azure Monitor.
    • Operações VMware Aria para monitoramento operacional.
    • Azure Policy e seu painel associado para monitoramento de conformidade.
    • Microsoft Defender para Nuvem e Microsoft Sentinel para monitoramento de segurança.

Gerenciar logs e arquivos

Impacto: Excelência operacional

Para obter dados de integridade de componentes da solução VMware, você precisa de acesso aos logs coletados pelo serviço de syslog do VMware. Exemplos de componentes da solução incluem VMware ESXi, VMware vSAN, VMware NSX-T Data Center e VMware vCenter Server. Os logs desses componentes estão disponíveis por meio da infraestrutura da Solução VMware no Azure. Um agente ou extensão do Log Analytics envia logs de convidado no nível da VM (máquina virtual) para o Log Analytics. Na Solução VMware no Azure, você pode enviar os logs da Solução VMware no Azure para um blob de armazenamento nativo do Azure. Para enviar logs para um blob de armazenamento, você pode configurar encaminhadores de um servidor de syslog centralizado ou configurar o blob como um destino no Azure Monitor. Também é possível usar uma ferramenta nativa do Azure, como Aplicativos Lógicos do Azure ou Azure Functions, para encaminhar logs. Você pode usar essas ferramentas para criar ouvintes para logs de entrada da Solução VMware do Azure e para enviar os logs para um blob de armazenamento.

O arquivamento de logs é uma estratégia para manter os custos de armazenamento baixos. Os blobs do Azure Storage e o Log Analytics podem transferir logs para arquivamento a longo prazo. Usar um blob de armazenamento é a opção mais barata. Mas o Log Analytics tem integrações avançadas para alertar, visualizar, consultar e obter insights baseados em machine learning. Considere seu orçamento, casos de uso funcionais e casos de uso de longo prazo ao escolher uma solução.

Recommendations
  • Colete logs do serviço de syslog do VMware para obter dados de integridade de componentes da solução VMware, como VMware ESXi, VMware vSAN, VMware NSX-T Data Center e VMware vCenter Server.
  • Configure ferramentas como o VMware Aria Operations for Logging para coletar vários logs para consulta, análise e geração de relatórios.
  • Configure as durações de retenção para enviar logs para o armazenamento de longo prazo para reduzir o tempo de consulta e economizar nos custos de armazenamento.

Monitorar o sistema operacional convidado

Impacto: Excelência operacional

No sistema operacional convidado, as métricas estão disponíveis para uso em disco, desempenho do aplicativo, utilização de recursos do sistema e atividade do usuário. Considere usar o Azure Arc para a Solução VMware no Azure (versão prévia) para gerenciar recursos de infraestrutura do VMware no Azure. Para obter mais informações, consulte Implantar o Azure Arc para a Solução VMware do Azure.

Recommendations
  • Habilite o gerenciamento de convidados e instale as extensões do Azure depois que sua nuvem privada for habilitada pelo Azure Arc para servidores ou a Solução VMware no Azure Arc (versão prévia).
  • Instale agentes extras para coletar dados para habilitar o gerenciamento e o monitoramento de convidados em VMs convidadas da Solução VMware no Azure.  

Implementar o monitoramento de segurança

Impacto: Segurança, excelência operacional

O monitoramento de segurança é fundamental para detectar e responder a atividades anômalas. As cargas de trabalho executadas em uma nuvem privada da Solução VMware no Azure precisam de um monitoramento de segurança abrangente que abrange redes, recursos do Azure e a própria nuvem privada da Solução VMware no Azure. Você pode centralizar eventos de segurança implantando um workspace do Microsoft Sentinel. Usando essa integração, a equipe de operação pode exibir, analisar e detectar incidentes de segurança no contexto de um cenário de ameaça organizacional mais amplo.

Recommendations
  • Habilite o Defender para Nuvem na assinatura do Azure que você usa para implantar a nuvem privada da Solução VMware no Azure. Verifique se, no plano do Defender para Nuvem, a configuração de Proteção de Carga de Trabalho na Nuvem (CWP) tem um valor de ativado para servidores.
  • Ações de auditoria que os usuários privilegiados assumem na nuvem privada da Solução VMware no Azure. Para obter mais informações, consulte o histórico de atividades de auditoria para atribuições de grupo no gerenciamento de identidade com privilégios.
  • Integre o Microsoft Sentinel ao Defender para Nuvem. Habilite seu coletor de dados para eventos de segurança e conecte-o ao Defender para Nuvem.
  • Use soluções de monitoramento de segurança de parceiros validados na Solução VMware no Azure.

Monitorar e analisar redes

Impacto: Segurança, excelência operacional

O processo de monitoramento de rede inspeciona todo o tráfego que entra e sai da nuvem privada da Solução VMware no Azure. Na Solução VMware no Azure, a segurança de rede opera nas camadas de rede e host.

Recommendations
  • Capture e monitore os logs de firewall de rede implantados na nuvem privada da Solução VMware no Azure. Monitore também os logs implantados no Azure quando seu aplicativo se estende a dispositivos nativos do Azure, como o Firewall do Azure ou o Gateway de Aplicativo do Azure. Para obter mais informações, confira Integração de firewall na Solução VMware no Azure.
  • Use a Pasta de Trabalho do Firewall do Azure ou ferramentas semelhantes para monitorar métricas e logs comuns relacionados a dispositivos de firewall.
  • Correlacionar logs de vários vetores de segurança, como identidade, rede e vetores de infraestrutura.

Configurar e simplificar alertas

Impacto: excelência operacional, otimização de custo

Ao executar cargas de trabalho na nuvem privada da Solução VMware no Azure, você precisa monitorar efetivamente o desempenho da carga de trabalho. Por exemplo, você deve capturar logs, métricas e solicitações de rastreamento para suas camadas de aplicativo e infraestrutura.

Os alertas podem ajudá-lo a responder às alterações na linha de base de desempenho. Você também pode usar alertas para fornecer informações sobre as alterações necessárias de manutenção ou configuração. Por exemplo, você pode receber notificações quando uma chave expira, uma conexão é perdida ou há o risco de exceder a capacidade de um recurso.

Para tornar os alertas eficazes, configure-os para notificar as equipes responsável quando determinadas condições forem atendidas. Considere também a consolidação de alertas para reduzir o número de notificações individuais enviadas:

  • Em vez de emitir um alerta para cada computador com pouco espaço, considere a consolidação de alertas por hosts, grupos de recursos ou clusters.
  • Use essa abordagem também com problemas de host, CPU e picos de armazenamento.
  • Baseie alertas em janelas de tempo. Por exemplo, se um host emitir alertas por um curto período de tempo, você poderá suprimir os alertas de acordo com um limite de tempo definido. Por exemplo, você pode enviar um alerta somente após cinco minutos.
Recommendations
  • Discutir e estabelecer linhas de base baseadas em dados de desempenho.
  • Defina critérios de alerta relevantes, como limites, níveis de severidade ou condições específicas.
  • Use o subsistema de eventos e alarmes do VMware vSphere para monitorar o VMware vSphere e configurar gatilhos.
  • Configure alertas do Azure na Azure VMware Solution para responder a eventos em tempo real.
  • Verifique se os alertas estão configurados para que o espaço frouxo do armazenamento de dados VMware vSAN seja mantido nos níveis exigidos pelo SLA (contrato de nível de serviço).
  • Configure alertas de integridade do recurso para obter o status de integridade em tempo real da nuvem privada da Solução VMware no Azure.
  • Use as ferramentas de APM (monitoramento de desempenho do aplicativo) para obter insights de desempenho no nível do código do aplicativo.
  • Use uma combinação de técnicas de monitoramento, como transações sintéticas, monitoramento de pulsação e monitoramento de ponto de extremidade.
  • Priorize alertas com base em seu impacto nas operações ou na criticidade dos sistemas afetados. Ajuste alertas para disparar apenas eventos significativos.
  • Para reduzir o ruído e gerenciar alertas efetivamente, use métodos para reduzir o número de notificações individuais emitidas.
  • Para minimizar a fadiga do alerta, empregue um mecanismo para notificar os principais stakeholders apenas sobre eventos significativos.
  • Use canais de notificação, como SMS, email, notificações por push e plataformas de colaboração, como o Microsoft Teams, para garantir que os alertas sejam entregues efetivamente.

Gerenciar os custos

Impacto: Otimização de custos, excelência operacional

O monitoramento de custos refere-se à capacidade de acompanhar os custos associados à nuvem privada da Solução VMware no Azure.

Recommendations
  • Use o subsistema de eventos e alarmes do VMware vSphere para monitorar o VMware vSphere e configurar triggers.
  • Configure alertas do Azure baseados em consultas do Log Analytics para o Azure VMware Solution. Esses alertas ajudam sua equipe de operação a responder a eventos esperados e inesperados em tempo real.

Usar ferramentas de solução de problemas e depuração

Impacto: Otimização de custos, excelência operacional

Para depurar e solucionar problemas de seu aplicativo com eficiência, você precisa de logs, métricas e informações associadas. Essas informações incluem atividades de evento para que você possa identificar, analisar e estabelecer conexões entre eventos.

Recommendations
  • Configurar seu sistema para encaminhar logs do serviço "Azure VMware Solution" para o Log Analytics. Encaminhe todos os logs, métricas e informações de diagnóstico relevantes.
  • Configure um agente de servidor habilitado pelo Azure Arc em VMs convidadas que são executadas dentro da nuvem privada da Solução VMware no Azure.

Usar painéis

Impacto: Excelência operacional

Os painéis de aplicativo ajudam você a visualizar e monitorar o desempenho, a integridade e outras métricas de um aplicativo:

  • O monitoramento de relatórios em dashboards ajuda você a fazer a análise de causa raiz e a solução de problemas rapidamente. As equipes de operações podem usar esses painéis para exibir todos os principais recursos que compõem a Solução VMware no Azure em um único painel.
  • As métricas do painel fornecem informações sobre como as alterações de código e infraestrutura afetam o comportamento do aplicativo.
  • Os visuais ajudam as equipes de suporte ao cliente a entender o impacto das alterações, do desempenho e dos problemas de disponibilidade em um aplicativo.
  • Os indicadores de desempenho beneficiam a liderança executiva e os stakeholders de negócios. Essas ferramentas informam decisões que alinham o desempenho de um aplicativo com os objetivos de negócios. Por exemplo, um executivo pode monitorar o compromisso com os clientes examinando métricas como disponibilidade do serviço, tempos de resolução de incidentes e tempos médios de resposta. Essas métricas ajudam a garantir que a organização forneça serviços de acordo com seu SLA.

Além de oferecer insights, os painéis também podem promover a transparência e incentivar a colaboração, por exemplo, quando você concede acesso aos stakeholders apropriados aos painéis do aplicativo. Esse ato cultiva uma compreensão compartilhada do desempenho de um aplicativo. Essa prática também permite que uma organização tome decisões informadas. Como resultado, os stakeholders podem se concentrar em buscar iniciativas cruciais que impulsionem os negócios.

Recommendations
  • Crie um painel de aplicativo com o Application Insights ou o Grafana. Conecte o painel a fontes de dados relevantes que armazenam métricas do ambiente da Solução VMware no Azure.
  • Crie uma pasta de trabalho do Azure como um repositório central para consultas, métricas e relatórios interativos normalmente executados.
  • Verifique se a fonte de dados está alinhada com os requisitos de segurança e conformidade.
  • Defina controles de acesso e permissões, como autenticação de usuário e controle de acesso baseado em função. Verifique se cada stakeholder tem acesso apropriado com base em sua função.
  • Realize revisões periódicas de acesso para verificar se o acesso do usuário está atualizado e alinhado com as funções e as responsabilidades atuais.

Próximas etapas

Agora que você analisou as melhores práticas de observabilidade na Solução VMware no Azure, explore mecanismos, ferramentas e perímetros que você pode usar para proteger ainda mais as cargas de trabalho no SDDC.

Use a ferramenta de avaliação para avaliar suas opções de design.