Compartilhar via


Solução de Integridade de Agentes no Azure Monitor

A solução de Integridade do Agente no Azure ajuda você a entender quais agentes de monitoramento não estão respondendo e enviando dados operacionais. Isso inclui todos os agentes que se reportam diretamente ao workspace do Log Analytics no Azure Monitor ou a um grupo de gerenciamento do System Center Operations Manager conectado ao Azure Monitor.

Você também pode usar a solução de Saúde do Agente para:

  • Acompanhe quantos agentes são implantados e onde eles são distribuídos geograficamente.
  • Execute outras consultas para manter a conscientização sobre a distribuição de agentes implantados no Azure, em outros ambientes de nuvem ou localmente.

Importante

A solução Agent Health monitora somente a saúde do agente do Log Analytics, que será depreciado a partir de 31 de agosto de 2024. Essa solução não monitora a integridade do agente do Azure Monitor.

Pré-requisitos

Antes de implantar essa solução, confirme se você possui agentes do Windows que se reportam ao workspace do Log Analytics ou que se reportam a um grupo de gerenciamento do Operations Manager integrado ao seu workspace.

Pacotes de gerenciamento

Se o grupo de gerenciamento do Operations Manager estiver conectado a um workspace do Log Analytics, os pacotes de gerenciamento a seguir serão instalados no Operations Manager. Esses pacotes de gerenciamento também são instalados em computadores Windows conectados diretamente depois que você adiciona esta solução:

  • Pacote de Inteligência de Canal Direto do Microsoft System Center Advisor HealthAssessment (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Pacote de Inteligência do Microsoft System Center Advisor Channel para HealthAssessment Server (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

Não há nada para configurar ou gerenciar com esses pacotes de gerenciamento. Para obter mais informações sobre como os pacotes de gerenciamento de soluções são atualizados, consulte Connect Operations Manager to Log Analytics.

Configuração

Adicione a solução Agent Health ao workspace do Log Analytics usando o processo descrito em Adicionar soluções. Nenhuma configuração adicional é necessária.

Agentes com suporte

A tabela a seguir descreve as fontes conectadas às quais essa solução dá suporte.

Origem conectada Suportado Description
Agentes do Windows Yes Eventos de pulsação são coletados de agentes diretos do Windows.
Grupo de gerenciamento do System Center Operations Manager Yes Os eventos de pulsação são coletados de agentes que relatam ao grupo de gerenciamento a cada 60 segundos e, em seguida, são encaminhados para o Azure Monitor. Não é necessária uma conexão direta dos agentes do Operations Manager com o Azure Monitor. Os dados de evento de pulsação são encaminhados do grupo de gestão para o espaço de trabalho do Log Analytics.

Usar a solução

Quando você adiciona a solução ao workspace do Log Analytics, o bloco Integridade do Agente é adicionado ao painel. Este bloco mostra o número total de agentes e o número de agentes sem resposta nas últimas 24 horas.

Captura de tela que mostra o bloco Integridade do Agente no painel.

Selecione o bloco integridade do agente para abrir o painel integridade do agente . O painel de controle inclui as colunas na tabela a seguir. Cada coluna lista os 10 principais eventos por contagem que correspondem aos critérios dessa coluna para o intervalo de tempo especificado. Você pode executar uma pesquisa de log que fornece a lista inteira. Selecione Ver tudo abaixo de cada coluna ou selecione o título da coluna.

Coluna Description
Contagem de agentes ao longo do tempo Uma tendência do número de agentes durante um período de sete dias para agentes Linux e Windows
Contagem de agentes não responsivos Uma lista de agentes que não enviaram uma pulsação nas últimas 24 horas
Distribuição por tipo de sistema operacional Uma partição de quantos agentes windows e Linux você tem em seu ambiente
Distribuição por versão do agente Uma partição das versões do agente instaladas em seu ambiente e uma contagem de cada uma
Distribuição por categoria de agente Uma partição das categorias de agentes que estão enviando eventos de pulsação: agentes diretos, agentes do Operations Manager ou o servidor de gerenciamento do Operations Manager
Distribuição por grupo de gerenciamento Uma partição dos grupos de gerenciamento do Operations Manager no seu ambiente
Localização geográfica dos agentes Uma partição dos países/regiões onde você tem agentes e uma contagem total do número de agentes que foram instalados em cada país/região
Contagem de gateways instalados O número de servidores que têm o gateway do Log Analytics instalado e uma lista desses servidores

Captura de tela que mostra um exemplo do painel da solução Agent Health.

Registros de log do Azure Monitor

A solução cria um tipo de registro no workspace do Log Analytics: pulsação. Os registros de pulsação têm as propriedades listadas na tabela a seguir.

Propriedade Description
Type Heartbeat
Category Direct Agent, SCOM Agent ou SCOM Management Server
Computer Nome do computador
OSType Sistema operacional Windows ou Linux
OSMajorVersion Versão principal do sistema operacional
OSMinorVersion Versão menor do sistema operacional
Version Versão do agente do Log Analytics ou do agente do Operations Manager
SCAgentChannel Direct e/ou SCManagementServer
IsGatewayInstalled true se o gateway do Log Analytics estiver instalado; caso contrário false
ComputerIP Endereço IP público para uma máquina virtual do Azure, se estiver disponível; Endereço SNAT do Azure (não o endereço IP privado) para uma máquina virtual que usa um IP privado
ComputerPrivateIPs Lista de IPs privados do computador
RemoteIPCountry Localização geográfica em que o computador é implantado
ManagementGroupName Nome do grupo de gestão do Operations Manager
SourceComputerId ID exclusiva do computador
RemoteIPLongitude Longitude da localização geográfica do computador
RemoteIPLatitude Latitude da localização geográfica do computador

Cada agente que se reportar a um servidor de gerenciamento do Operations Manager enviará dois sinais de vida. O valor da propriedade SCAgentChannel incluirá Direct e SCManagementServer, dependendo das fontes de dados e soluções de monitoramento que você ativou em sua assinatura.

Se você se lembrar, os dados das soluções são enviados de duas maneiras:

  • Diretamente de um servidor de gerenciamento do Operations Manager para o Azure Monitor.
  • Diretamente do agente para o Azure Monitor, devido ao volume de dados coletados no agente.

Para eventos de pulsação que têm o valor SCManagementServer, ComputerIP é o valor do endereço IP do servidor de gerenciamento porque ele de fato transfere os dados. Para as pulsações, onde SCAgentChannel está configurado como Direct, é o endereço IP público do agente.

Exemplos de pesquisas de log

A tabela a seguir fornece pesquisas de log de exemplo para registros coletados pela solução.

Query Description
Pulsação | Computador especial Número total de agentes
Heartbeat | sumarizar ÚltimaChamada = máx(TempoGerado) por Computador | onde ÚltimaChamada < atrás(24h) Contagem de agentes sem resposta nas últimas 24 horas
Pulsação | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(15m) Contagem de agentes não responsivos nos últimos 15 minutos
Pulsação | onde TimeGenerated > ago(24h) e Computer in ((Heartbeat | where TimeGenerated > ago(24h) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Computadores online nas últimas 24 horas
Pulsação | onde TimeGenerated > ago(24h) e Computer !in ((Pulsação | onde TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Total de agentes offline nos últimos 30 minutos (nas últimas 24 horas)
Sinal de Pulso | summarize AggregatedValue = dcount(Computer) by OSType Tendência do número de agentes ao longo do tempo por tipo de sistema operacional
Pulsação | summarize AggregatedValue = dcount(Computer) by OSType Distribuição por tipo de sistema operacional
Monitoramento | resumo ValorAgregado = dcount(Computer) por Versão Distribuição por versão do agente
Pulsação | resumir ValorAgregado = count() por Categoria Distribuição por categoria de agente
Pulsação | summarize AggregatedValue = dcount(Computador) by NomeGrupoGestão Distribuição por grupo de gerenciamento
Pulsação | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry Localização geográfica dos agentes
Pulsação | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | Computador distinto Número de gateways do Log Analytics instalados

Próximas etapas

Saiba mais sobre como gerar alertas de consultas de log no Azure Monitor.