Compartilhar via


Observabilidade do Azure Operator Nexus

A estrutura de observabilidade do Operator Nexus fornece insights operacionais sobre suas instâncias locais. A estrutura oferece suporte ao registro, monitoramento e alertas (LMA), à análise e à visualização de dados e métricas operacionais (plataforma e cargas de trabalho).

Captura de tela do Operador Nexus Logging, Monitoring and Alerting (LMA) Framework.

Figura: Operador Nexus de Registro, Monitoramento e Alerta (LMA) Framework

Os principais destaques da estrutura de observabilidade do Operador Nexus são:

  • Coleta de dados centralizada: a solução de observabilidade do Operador Nexus baseia-se em uma coleção de todos os dados em um local central. Aqui, você pode observar os dados de monitoramento de todas as suas instâncias on-premises.
  • Ferramentas bem definidas e testadas: a solução depende do Azure Monitor que coleta, analisa e atua em dados de telemetria de suas instâncias locais e de nuvem.
  • Fácil de aprender e usar: a solução facilita a análise e a depuração de problemas com a capacidade de pesquisar os dados de dentro ou de todas as instâncias locais e de nuvem.
  • Ferramentas de visualização: você cria dashboards e pastas de trabalho personalizados de acordo com suas necessidades.
  • Ferramentas de Alerta Integrado: você cria alertas com base em limites personalizados. Você pode criar e reutilizar modelos de alerta em todas as instâncias.

Este artigo ajuda você a entender a estrutura de observabilidade do Operador Nexus que consiste em uma pilha de componentes:

  • O Azure Monitor coleta e agrega dados de log dos componentes do Operador Nexus
  • O LAW (Workspace do Azure Log Analytics) coleta e agrega dados de log de várias assinaturas e locatários do Azure
  • Análise, visualização e alertas são executados nos dados de log agregados.

Monitoramento de plataforma

O Operador Nexus oferece visibilidade do desempenho de suas implantações que consistem em recursos de infraestrutura. Você precisa que os registros e as métricas sejam recolhidos e analisados desses recursos de plataforma. Você obtém insights valiosos da coleção centralizada e da agregação de dados de todas as fontes, em comparação com os dados não agregados.

Esses logs e métricas são usados para observar o estado da plataforma. Você pode ver o desempenho e analisar o que está errado. Você pode analisar o que causou a situação. A visualização ajuda você a configurar os alertas necessários e sob quais condições. Por exemplo, você pode configurar os alertas a serem gerados quando os recursos estiverem se comportando de forma anormal ou quando os limites forem atingidos. Você pode usar os logs e análises coletados para depurar quaisquer problemas no ambiente.

Dados de monitoramento

A observabilidade do operador Nexus permite que você colete o mesmo tipo de dados que outros recursos do Azure. Os dados coletados de cada uma de suas instâncias podem ser exibidos em seu LAW.

Você pode aprender a monitorar os recursos do Azure aqui.

Coleta e roteamento

A observabilidade do Operador Nexus permite que você colete dados para cada recurso de infraestrutura. O conjunto de componentes de infraestrutura inclui:

  • Malha de rede que inclui CEs, TORs, NPBs, comutadores de gerenciamento e o servidor de terminal.
  • Computação que inclui os servidores Bare Metal.
  • Plano de Controle do Undercloud (cluster Kubernetes responsável pela implantação e gerenciamento do ciclo de vida geral da Plataforma).

A coleta de dados de log dessas camadas é habilitada por padrão durante a criação da instância do Operador Nexus. Esses logs coletados são roteados para o Azure Monitor LAW.

Você também pode coletar dados das camadas de tenant criadas para executar funções de rede conteinerizadas e virtualizadas. Os dados de log que podem ser coletados incluem:

  • Coleta de syslog de Máquinas Virtuais (utilizado para VNFs ou cargas de trabalho CNF).
  • Coleção de logs de clusters do Kubernetes e dos aplicativos executados sobre eles.

Você precisará habilitar a coleta de logs dos clusters Kubernetes do locatário e das máquinas virtuais. Você deve seguir as etapas para implantar os agentes de monitoramento do Azure. Os dados seriam coletados em seu Azure LAW.

Armazenamento de logs do Operador Nexus

Os dados em Logs do Azure Monitor são armazenados em tabelas em que cada tabela tem o próprio conjunto de propriedades exclusivas.

Todos os logs de recursos no Azure Monitor têm os mesmos campos seguidos por campos específicos do serviço; consulte o esquema comum.

Os logs da plataforma Operator Nexus são armazenados nas seguintes tabelas:

Table Description
Syslog Eventos do Syslog em computadores Linux usando o agente do Log Analytics
ContainerInventory Detalhes e estado atual de cada contêiner.
ContainerLog Linhas de log coletadas de fluxos stdout e stderr para contêineres
ContainerNodeInventory Detalhes dos nós que atuam como hosts de contêiner.
InsightMetrics Métricas coletadas do Servidor, K8s, Contêineres.
KubeEvents Eventos do Kubernetes e suas propriedades.
KubeMonAgentEvents Eventos registrados pelo agente Azure Monitor Kubernetes para erros e avisos.
KubeNodeInventory Detalhes dos nós que fazem parte de um cluster Kubernetes
KubePodInventory Pods do Kubernetes e suas propriedades
KubePVInventory Volumes persistentes do Kubernetes e suas propriedades.
KubeServices Serviços do Kubernetes e suas propriedades
Heartbeat Registros coletados por agentes do Log Analytics uma vez por minuto para relatar a saúde do agente

Métricas de nexo do operador

A tabela 'InsightMetrics' na seção Logs contém as métricas coletadas das Máquinas Bare Metal e do cluster Kubernetes sob nuvem. Além disso, algumas métricas selecionadas coletadas da nuvem subnuve podem ser observadas abrindo a guia Métricas no menu do Azure Monitor.

Captura de tela da Seleção de Métricas do Azure Monitor.

Figura: Seleção de Métricas do Azure Monitor

Consulte Analisar métricas com o Gerenciador de métricas do Azure Monitor para obter detalhes sobre como usar essa ferramenta.

Pastas de Trabalho

As pastas de trabalho combinam texto, consultas de log, métricas e parâmetros para análise de dados e a criação de vários tipos de visualizações avançadas. Você pode usar os modelos de pasta de trabalho de exemplo do Azure Resource Manager para o Operador Nexus para registro em log e monitoramento a fim de implantar pastas de trabalho do Azure em seu Azure LAW.

Alerts

Você pode usar os modelos de alarme do Azure Resource Manager de exemplo para regras de alerta do Operador Nexus. Você deve especificar limites e condições para os alertas. Em seguida, você pode implantar esses modelos de alerta em seu ambiente local.

Alertas de capacidade de hardware

O limite de capacidade de hardware para dispositivos é definido em 60%e os limites de TrafficPolicy são definidos em 35%. Todos os alertas serão publicados por meio do syslog.

Log Analytic Workspace

Um LAW (Espaço de Trabalho do Log Analytics) é um ambiente exclusivo para registrar dados do Azure Monitor e de outros serviços do Azure. Cada workspace tem seu próprio repositório de dados e configuração, mas pode combinar dados de vários serviços. Cada workspace consiste em várias tabelas de dados.

Uma única LEI pode ser criada para coletar todos os dados relevantes ou vários workspaces com base nos requisitos do operador.