Partilhar via


O que são logs de rede de contêiner (visualização)?

Importante

Renomeação dos componentes (a partir de 11 de novembro de 2025)

Estamos a renomear componentes na funcionalidade Container Network Logs para melhorar a clareza e consistência:

O que muda

  • CRD: RetinaNetworkFlowLogsContainerNetworkLog
  • Parâmetro CLI: --enable-retinanetworkflowlog--enable-container-network-logs
  • Tabela de Análise de Logs: RetinaNetworkFlowLogsContainerNetworkLog

Itens de ação para utilizadores existentes permitirem novas nomeações

  1. Atualizar Azure CLI (OBRIGATÓRIO - Primeiro passo!):

    az upgrade
    
  2. Pré-visualização da atualização Extensão da CLI (OBRIGATÓRIA):

    az extension update --name aks-preview
    
  3. Desativar a monitorização:

    az aks disable-addons -a monitoring -n <cluster-name> -g <resource-group>
    
  4. Reativar a Monitorização:

    az aks enable-addons -a monitoring --enable-high-log-scale-mode -g <resource-group> -n <cluster-name>
    
  5. Reativar os Logs de Rede de Contêineres ACNS:

    az aks update --enable-acns --enable-container-network-logs -g <resource-group> -n <cluster-name>
    
  6. Aplique o novo CRD ContainerNetworkLog: Aplique a sua configuração atualizada do CRD com a nova denominação.

  7. Reimportar Painéis Grafana: Importar os painéis atualizados para refletir os novos nomes das tabelas.

Observação

  • Os dados previamente recolhidos permanecem no seu espaço de trabalho na tabela antiga RetinaNetworkFlowLogs.
  • Após a reativação, permita um pequeno atraso antes que novos dados apareçam na nova tabela ContainerNetworkLog.

Os registos de redes de contentores no Advanced Container Networking Services for Azure Kubernetes Service (AKS) proporcionam uma visibilidade abrangente e rica em contexto de cada fluxo de rede dentro do seu cluster. Enquanto as métricas indicam o que está a acontecer na sua rede (como o uso de largura de banda ou taxas de erro), os registos da rede de contentores explicam porquê , capturando a história completa de cada ligação — incluindo quem a iniciou, que protocolos foram usados e se o tráfego foi permitido ou bloqueado.

Estes registos capturam metadados essenciais para cada fluxo de rede, incluindo endereços IP de origem e destino, nomes de pods e serviços, espaços de nomes, portas, protocolos, direção de tráfego e veredictos de políticas. Esta informação contextual profunda permite-lhe correlacionar o comportamento da rede com cargas de trabalho específicas, resolver problemas de conectividade, validar políticas de segurança e realizar análises forenses.

Os registos de rede de contentores captam tráfego de Camada 3 (IP), Camada 4 (TCP/UDP) e Camada 7 (HTTP/gRPC/Kafka), fornecendo os insights detalhados necessários para monitorizar a conectividade, resolver problemas, visualizar a topologia da rede, aplicar políticas de segurança e garantir a conformidade.

Escolha entre dois modos:

  • Registos armazenados
  • Registos a pedido

Registos armazenados

O modo de logs armazenados garante a geração e coleta contínuas de logs no cluster AKS quando você habilita os Serviços Avançados de Rede de Contêiner e configura filtros personalizados. Por defeito, a recolha de registos está desativada.

Para habilitar a coleta de logs, defina recursos personalizados para especificar os tipos de tráfego a serem monitorados. Os exemplos incluem namespaces, pods, serviços e protocolos. Esse recurso permanece ativo até que você o desative.

O modo de registos armazenados suporta retenção prolongada de registos e filtragem de tráfego. Para custos de armazenamento reduzidos e análise mais fácil, pode recolher e manter apenas os registos que lhe são relevantes.

Como funciona o modo de logs armazenados

O Advanced Container Networking Services usa a tecnologia eBPF com o Cilium para buscar logs de nós em seu cluster. Para começar a coletar logs, defina um ou mais recursos personalizados para especificar os tipos de tráfego a serem monitorados.

Os recursos personalizados fornecem controlo detalhado para definir e capturar o tráfego relevante para si. O agente do Cilium em execução em cada nó recolhe o tráfego de rede que corresponde aos critérios definidos nos recursos personalizados. Os logs são armazenados no formato JSON no host, fornecendo um formato estruturado e acessível para uso posterior.

Como alternativa, se o complemento Azure Monitoring estiver habilitado, os agentes do Container insights coletam os logs do host, aplicam os limites de limitação padrão e os enviam para um espaço de trabalho do Log Analytics. O sistema agrega e armazena registos de forma eficiente para fornecer visibilidade do tráfego de rede para monitorização, resolução de problemas e aplicação da segurança.

Diagrama de como os logs de rede de contêiner funcionam.

Para ler mais sobre limitação e Insights sobre Contentores, consulte a documentação de Insights sobre Contentores.

Principais capacidades do modo de armazenamento de logs

  • Filtros personalizáveis. Pode configurar o registo definindo recursos personalizados do tipo ContainerNetworkLog . Use recursos personalizados para aplicar filtros granulares por namespace, pod, serviço, porta, protocolo, veredicto ou direção de tráfego (entrada ou saída). Esta flexibilidade assegura uma recolha precisa de dados adaptada a casos de uso específicos. Somente o tráfego relevante é registrado e o armazenamento é otimizado para melhorar o desempenho, a conformidade e a solução de problemas.

  • Opções de armazenamento de log. O recurso de logs de rede de contêiner tem duas opções principais de armazenamento: armazenamento não gerenciado e armazenamento gerenciado.

    • Armazenamento não gerido: Quando um recurso personalizado é aplicado para iniciar a recolha de registos, os registos de fluxo de rede são armazenados localmente nos nós anfitriões na /var/log/acns/hubble localização fixa de montagem. Esse local de armazenamento é temporário porque o nó em si não é uma solução de armazenamento persistente. Quando os ficheiros de registo atingem um tamanho de 50 MB, são automaticamente rotacionados e os registos mais antigos são sobrescritos. Essa solução de armazenamento é adequada para monitoramento em tempo real, mas não suporta armazenamento ou retenção de longo prazo.

      Para capacidades adicionais de gestão de registos, pode integrar serviços de logging de parceiros, como um coletor OpenTelemetry. As integrações com parceiros oferecem flexibilidade para gerir logs fora do ecossistema Azure e são úteis se já tiver implementado uma plataforma específica de gestão de logs.

    • Armazenamento gerenciado: Para retenção de longo prazo e análises avançadas, recomendamos que você configure o monitoramento do Azure em seu cluster AKS para coletar e armazenar logs em um espaço de trabalho do Log Analytics. Esta configuração garante armazenamento de registos seguro e compatível. Também oferece acesso a capacidades poderosas como deteção de anomalias, ajuste de desempenho e análise histórica de dados. Você pode usar logs históricos para identificar tendências, comportamentos de linha de base e resolver problemas recorrentes de forma proativa.

      Por exemplo, pode usar o serviço gerido do Prometheus para configurar alertas tanto em métricas como em logs para monitorização em tempo real e deteção rápida de valores atípicos.

      Você usa o mesmo espaço de trabalho para armazenamento de logs. Você configura o espaço de armazenamento de log durante a inicialização. Tanto o Analytics como os planos básicos de tabelas logarítmica são suportados para esta funcionalidade. Para obter informações mais detalhadas sobre planos de tabela, consulte Azure Monitor Logs.

  • Visualização simples nos dashboards do Log Analytics e do Grafana. Os registos e dados apresentados nos dashboards do Grafana simplificam a informação complexa, facilitam a compreensão de dados e ajudam-no a tomar decisões mais rapidamente.

Visualização de logs no portal do Azure

Você pode visualizar, consultar e analisar logs de fluxo no portal do Azure no espaço de trabalho do Log Analytics para seu cluster.

Captura de tela dos logs de rede do contêiner em um espaço de trabalho do Log Analytics.

Visualização de logs em painéis do Grafana

  • Acesse os logs de fluxo em uma instância do Azure Managed Grafana.

    Para simplificar sua análise de logs, fornecemos dois painéis Grafana pré-configurados:

    • Vá para Azure>Insights>Contentores>Rede>Registos de Fluxo. Este painel mostra quais cargas de trabalho do AKS estão se comunicando entre si, incluindo solicitações de rede, respostas, quedas e erros. Atualmente, como uma etapa provisória durante a visualização, você deve importar painéis do Grafana usando uma ID de usuário para exibir o painel de logs de fluxo no portal do Azure.

      Captura de tela de um painel do Flow Logs Grafana em uma instância do Managed Grafana.

    • Vá para Azure>Insights>Containers>Rede>Logs de Fluxo (Tráfego Externo). Este painel mostra quais cargas de trabalho do AKS enviam e recebem comunicações de fora de um cluster AKS, incluindo solicitações de rede, respostas, quedas e erros.

      Captura de ecrã de um painel Grafana de Registos de Fluxo (Externo) numa instância de Grafana Gerido.

      Para obter mais informações, consulte Configurar o Azure Managed Grafana com Serviços Avançados de Rede de Contêiner.

  • Aceda aos registos de fluxo no portal do Azure através da opção de Painéis com Grafana.

    Captura de ecrã dos dashboards do Grafana no Azure Monitor.

Os painéis do portal do Azure têm os seguintes componentes principais:

  • Uma visão abrangente da integridade da rede. Vê-se métricas-chave como registos de fluxo total, pedidos únicos, pedidos cancelados e pedidos encaminhados para deteção rápida de anomalias e resolução eficiente de problemas. O painel categoriza as estatísticas por protocolo e comportamento, incluindo solicitações de DNS descartadas, respostas HTTP 2xx, taxas de solicitação e resposta de Camada 4 e contagens de solicitações descartadas. Um gráfico de dependência de serviço visualiza interações de aplicativo ou cluster, destacando fluxo de tráfego, gargalos e dependências para otimização de desempenho.

    Captura de tela de estatísticas de logs de fluxo e um gráfico de dependência de serviço.

  • Registos de fluxo e de erro para uma análise rápida. Você pode filtrar logs de fluxo para análise de causa básica. Por exemplo, para resolver problemas com o Sistema de Nomes de Domínio (DNS), filtre os registos de erro pelo protocolo DNS.

    Captura de ecrã de logs de fluxo e de erro.

    Separar registos de fluxo e registos de erros ajuda-o a analisar os problemas mais rapidamente. Pode identificar e corrigir erros sem filtrar informações não relacionadas, o que melhora a eficiência na resolução de problemas e processos de depuração.

    Use etiquetas claras e carimbos temporais para cada entrada de registo para identificar mais facilmente eventos ou erros específicos nos seus sistemas ou processos.

    Captura de ecrã dos filtros disponíveis nos dashboards do portal do Azure.

  • Principais namespaces, cargas de trabalho e erros de DNS. A visualização do registo de fluxo de rede é vital para monitorizar e analisar a comunicação num cluster AKS. Fornece informações sobre namespaces, cargas de trabalho, utilização de portas e utilização de consultas. Ele ajuda a identificar tendências, detetar gargalos e diagnosticar problemas. Detetar atividade significativa da rede, visualizar pedidos perdidos e avaliar a distribuição do protocolo (por exemplo, TCP versus UDP). Esta seção de visão geral do painel oferece suporte à integridade do cluster, otimização de recursos e segurança, detetando e exibindo padrões de tráfego incomuns.

    Captura de ecrã dos principais namespaces e métricas de pod.

Registos a pedido

Advanced Container Networking Services oferece captura sob demanda de logs de fluxo de rede. Obtenha visibilidade em tempo real sem configuração prévia ou armazenamento persistente usando a CLI do Hubble e a interface do usuário do Hubble. Este modo de registos a pedido está disponível. Para saber como configurar armazenamento de registos sob demanda, consulte Configurar a CLI do Hubble e a interface do Hubble.

Hubble CLI

A interface de linha de comando (CLI) do Hubble fornece uma maneira flexível e interativa de consultar, filtrar e analisar logs de fluxo diretamente no terminal. Você pode executar comandos em tempo real para inspecionar fluxos de tráfego, exibir metadados de pacotes e solucionar problemas de rede sem sair do ambiente operacional.

Captura de tela da CLI do Hubble.

Interface do usuário do Hubble

A interface baseada na Web do Hubble oferece uma plataforma intuitiva e visual para monitoramento. Com recursos como painéis de tráfego em tempo real, resumos de fluxo e logs pesquisáveis, você pode facilmente rastrear a comunicação serviço-a-serviço, detetar anomalias e obter informações sobre a atividade do cluster.

As ferramentas da interface do Hubble proporcionam visibilidade em tempo real e insights acionáveis para uma resolução de problemas mais rápida e uma melhor gestão de rede.

Captura de tela da interface do usuário do Hubble.

Principais benefícios dos logs sob demanda

  • Resolução de problemas mais rápida. Com informações detalhadas e acionáveis sobre o tráfego de rede, pode identificar e resolver problemas de conectividade ou desempenho mais rapidamente, minimizando o tempo de inatividade e as interrupções.
  • Eficiência operacional otimizada. Logs agregados e armazenados de forma eficiente reduzem a sobrecarga de gerenciamento de dados. A sua equipa pode concentrar-se na análise e na tomada de decisões em vez de gerir grandes volumes de dados brutos.
  • Maior confiabilidade do aplicativo. Ao monitorizar a comunicação entre serviços e detetar anomalias, pode resolver proativamente potenciais problemas e garantir uma experiência de aplicação mais fluida e fiável.
  • Melhor tomada de decisão. Visualizar padrões de rede no Azure Managed Grafana e aplicar mapas de serviço fornece insights claros sobre o comportamento da sua aplicação. Isto conduz a uma melhoria do planeamento e otimização da infraestrutura.
  • Redução de custos. A agregação eficiente de logs e os escopos de registo personalizáveis reduzem os custos de armazenamento e ingestão de dados, proporcionando uma solução económica para monitorização de redes a longo prazo.
  • Conformidade e segurança simplificadas. Logs persistentes e abrangentes oferecem suporte a trilhas de auditoria, conformidade regulatória e rápida identificação de tráfego suspeito. Eles ajudam a manter um ambiente seguro e em conformidade.

Limitações

  • Atualmente, os logs de rede de contêiner no modo de logs armazenados funcionam apenas com o plano de dados do Cilium.
  • Os logs de fluxo da Camada 7 são capturados somente quando o suporte à política da Camada 7 está habilitado. Para obter mais informações, consulte Configurar uma política de camada 7.
  • Os fluxos e métricas de DNS são capturados somente quando uma diretiva de rede FQDN (Domínio Totalmente Qualificado) da Cilium é aplicada. Para obter mais informações, consulte Configurar uma política FQDN.
  • A integração usando o Terraform atualmente não é suportada.
  • Quando o Log Analytics não está configurado para armazenamento de logs, os logs de rede de contêiner são limitados a um máximo de 50 MB de armazenamento. Quando esse limite é atingido, novas entradas substituem logs mais antigos.
  • Se o plano de tabela estiver definido como logs básicos, os painéis Grafana pré-construídos não funcionarão.
  • O plano da tabela de logs auxiliares não é suportado.

Preços

Importante

Advanced Container Networking Services é uma oferta paga.

Para obter mais informações sobre preços, consulte Advanced Container Networking Services - Pricing.