Compartir a través de


¿Qué son las métricas de red de contenedor?

Advanced Container Networking Services en Azure Kubernetes Service (AKS) facilita la recopilación de métricas de red de contenedor completas para proporcionarle información valiosa sobre el rendimiento del entorno en contenedor. La funcionalidad captura continuamente métricas esenciales en el nivel de nodo y pod, incluido el volumen de tráfico, los paquetes eliminados, los estados de conexión y los tiempos de resolución del sistema de nombres de dominio (DNS) para una supervisión eficaz y la optimización del rendimiento de la red.

La captura de estas métricas es esencial para comprender cómo se comunican los contenedores, cómo fluye el tráfico entre los servicios y dónde pueden producirse cuellos de botella o interrupciones. Advanced Container Networking Services se integra perfectamente con herramientas de supervisión como Prometheus y Grafana para ofrecerle una vista completa de las métricas de red. Use las métricas para la solución de problemas detallada, la optimización de red y el ajuste del rendimiento.

En un mundo nativo de la nube, mantener una red correcta y eficaz en un entorno en contenedor dinámico es fundamental para garantizar que las aplicaciones funcionen según lo previsto. Sin una visibilidad adecuada del tráfico de red y sus patrones, la identificación de posibles problemas o ineficacias se vuelve difícil.

Important

A partir del 30 de noviembre de 2025, Azure Kubernetes Service (AKS) ya no admite ni proporciona actualizaciones de seguridad para Azure Linux 2.0. La imagen de nodo de Linux 2.0 de Azure está congelada en la versión 202512.06.0. A partir del 31 de marzo de 2026, se quitarán las imágenes de nodo y no podrá escalar los grupos de nodos. Migre a una versión compatible de Azure Linux mediante la actualización de los grupos de nodos a una versión de Kubernetes compatible o la migración a osSku AzureLinux3. Para más información, consulte [Retirada] Grupos de nodos de Azure Linux 2.0 en AKS.

Ventajas clave

  • Visibilidad profunda del rendimiento de la red

  • Solución de problemas y optimización mejoradas

  • Detección proactiva de anomalías

  • Mejor administración y escalado de recursos

  • Planeamiento y cumplimiento de la capacidad

  • Filtrado de métricas a nivel de origen para la optimización de costos y la reducción del ruido con filtrado de métricas de redes de contenedores

  • Opciones simplificadas de visualización y almacenamiento de métricas. Elija entre:

    • Servicio administrado de Azure para Prometheus y Azure Managed Grafana: Azure administra la infraestructura y el mantenimiento, por lo que puede centrarse en la configuración de métricas y la visualización de métricas.
    • Traiga su propio (BYO) Prometheus y Grafana: implemente y configure sus propias instancias de Prometheus y Grafana, y administre la infraestructura subyacente.

Métricas capturadas

Métricas de nivel de nodo

Comprender el estado de la red de contenedor en el nivel de nodo es fundamental para mantener un rendimiento óptimo de la aplicación. Estas métricas proporcionan información sobre el volumen de tráfico, los paquetes eliminados, el número de conexiones y otros datos por nodo. Las métricas se almacenan en formato Prometheus, por lo que puede verlos en Grafana.

Las métricas siguientes se agregan por nodo. Todas las métricas incluyen una de estas etiquetas:

  • cluster
  • instance (nombre del nodo)

Para escenarios de plano de datos de Cilium, la observabilidad de red de contenedor solo proporciona métricas para Linux. Actualmente no se admite Windows. Cilium expone varias métricas, entre las que se incluyen las siguientes usadas por la observabilidad de la red de contenedor.

Nombre de la medida Description Etiquetas adicionales Linux Windows
cilium_forward_count_total Recuento total de paquetes reenviados direction
cilium_forward_bytes_total Recuento total de bytes reenviados direction
cilium_drop_count_total Recuento total de paquetes descartados direction, reason
cilium_drop_bytes_total Recuento total de bytes descartados direction, reason

Métricas de nivel de pod (métricas de Hubble)

Estas métricas de Prometheus incluyen información de pod de origen y destino para que pueda identificar problemas relacionados con la red en un nivel granular. Las métricas cubren información como el volumen de tráfico, los paquetes eliminados, los restablecimientos tcp y los flujos de paquetes de capa 4/nivel 7. Las métricas de DNS, como los errores DNS y las solicitudes DNS que faltan, se recopilan de forma predeterminada para los planos de datos que no son de Cilium. Para los planos de datos de Cilium, se requiere una directiva de red FQDN de Cilium para recopilar métricas de DNS, o los clientes también pueden solucionar problemas de DNS mediante la CLI de Storage y observar registros en tiempo real.

En la tabla siguiente se describen las métricas agregadas por pod (se conserva la información del nodo).

Todas las métricas incluyen etiquetas:

  • cluster

  • instance (nombre del nodo)

  • source o destination

    • En el caso del tráfico saliente, se aplica una etiqueta source que indica el espacio de nombres y el nombre del pod de origen.

    • En el caso del tráfico entrante, se aplica una etiqueta destination que indica el espacio de nombres y el nombre del pod de destino.

Nombre de la medida Description Etiquetas adicionales Linux Windows
hubble_dns_queries_total Total de solicitudes DNS por consulta source o destination, query, qtypes (tipo de consulta)
hubble_dns_responses_total Total de respuestas DNS por consulta o respuesta source o destination, query, qtypes (tipo de consulta), rcode (código de retorno), ips_returned (número de direcciones IP)
hubble_drop_total Recuento total de paquetes descartados source o destination, protocol, reason
hubble_tcp_flags_total Recuento total de paquetes TCP por marca source o destination, flag
hubble_flows_processed_total Total de flujos de red procesados (tráfico de nivel 4/nivel 7) source o destination, protocol, verdict, type, subtype

Filtrado de métricas de la red del contenedor (versión preliminar)

Ahora que tiene la capacidad de recopilar métricas completas en los niveles de nodo y pod, es posible que se encuentre trabajando con un volumen significativo de datos. Para ayudar a reducir el ruido y optimizar los costos de almacenamiento, la observabilidad de la red de contenedor presenta el filtrado de métricas de red de contenedor. Esta característica le permite filtrar las métricas en el origen antes de que se recopilen y almacenen, lo que le proporciona control sobre qué métricas son más relevantes para sus necesidades específicas de supervisión y solución de problemas. Esta característica solo está disponible para clústeres de Cilium.

El filtrado de métricas de red de contenedores es especialmente valioso en entornos de producción a gran escala en los que el volumen de métricas puede afectar a los costos de almacenamiento y al rendimiento de las consultas. Al filtrar las métricas innecesarias al principio del proceso de recopilación, puede centrarse en los datos que más importan a las operaciones, a la vez que mantiene la visibilidad necesaria para una supervisión de red eficaz.

La funcionalidad de filtrado admite varias dimensiones, incluido el filtrado basado en espacios de nombres para centrarse en aplicaciones específicas, filtrado basado en pods y etiquetas para la supervisión dirigida y filtrado específico de métricas para recopilar solo los tipos de métricas que son esenciales para su caso de uso. Esta flexibilidad le permite alcanzar el equilibrio adecuado entre la observabilidad completa y las operaciones rentables.

Para más información sobre cómo habilitar el filtrado de métricas de red de contenedor, consulte Configuración del filtrado de métricas de red de contenedor .

Limitations

  • Las métricas de nivel de pod solo están disponibles en Linux.
  • Se admite el plano de datos con Cilium a partir de la versión 1.29 de Kubernetes.
  • Las etiquetas de métricas tienen diferencias sutiles entre los clústeres de Cilium y los que no son de Cilium.
  • En el caso de los clústeres basados en Cilium, las métricas de DNS solo están disponibles para pods que tienen directivas de red de Cilium (CNP) configuradas en sus clústeres, o los clientes también pueden solucionar problemas de DNS mediante la CLI de Azure y observar registros en tiempo real.
  • Los registros de flujo no están disponibles actualmente en la nube con disponibilidad inalámbrica.
  • La retransmisión de Hubble puede bloquearse si uno de los agentes de nodo de Hubble se cae y puede causar interrupciones en Hubble CLI.
  • Al usar Advanced Container Networking Services (ACNS) en planos de datos que no son de Cilium, la compatibilidad con FIPS no está disponible en nodos de Ubuntu 20.04 debido a restricciones de kernel. Para habilitar FIPS en este escenario, debe usar un grupo de nodos de Linux de Azure. Se espera que esta limitación se resuelva con la versión de Ubuntu 22 FIPS. Para obtener actualizaciones, consulte el seguimiento de problemas de AKS.
  • El filtrado de métricas de red de contenedor solo está disponible para clústeres de Cilium.

Consulte la matriz de compatibilidad de FIPS siguiente:

Sistema operativo Compatibilidad con FIPS
Azure Linux 3.0 Yes
Azure Linux 2.0 Yes
Ubuntu 20.04 No

Esta limitación no se aplica cuando ACNS se ejecuta en planos de datos de Cilium.

Scale

El servicio administrado para Prometheus en Azure Monitor y Azure Managed Grafana imponen limitaciones de escala específicas del servicio. Para más información, consulte Métricas de Scrape Prometheus a gran escala en Azure Monitor.

Pricing

Important

Los servicios avanzados de redes de contenedores es una oferta de pago.

Para obtener más información sobre los precios, consulte Servicios avanzados de redes de contenedores: precios.