你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 负载均衡器运行状况事件日志

Azure 负载均衡器支持运行状况事件日志,以帮助你识别和排查会影响负载均衡器资源运行状况的持续问题。 这些事件通过 Azure Monitor 资源日志类别 LoadBalancerHealthEvent 提供。

标准层(区域层和全局层)和网关负载均衡器支持这些日志。

严重性定义

每个运行状况事件类型都具有关联的严重性,用于指示预期影响级别。 此属性有助于根据问题的紧迫性筛选日志和创建更个性化的警报。

严重性 说明
严重 需要立即关注该负载均衡器资源。 负载均衡器的功能受到影响。 这种影响可能会导致连接失败、CRUD(创建、读取、更新、删除)操作失败或负载均衡器组件配置错误等问题。
警告 需要监视或查看负载均衡器资源。 负载均衡器的功能在某些情况下可能会受到影响,或者在部分降级状态下运行。

运行状况事件类型和发布频率

可通过各种方式检测运行状况事件,某些事件是通过主动检查负载均衡器的状态生成的,而其他事件可以在满足显式条件时生成。 如果事件发生在检测期间,则每个事件都有可能每分钟发布一次。

发布运行状况事件后,会有一个不重新发布该事件的扩展时间范围。 此时间范围可防止在出现永久性问题时发布过多的日志。 在此重新检测间隔之后,如果问题仍然存在,则会重新发布运行状况事件。

发布的每个事件日志都带有一个时间戳,该时间戳指示 Azure 负载均衡器在平台级别检测到事件的时间。 在 Azure Monitor 进行检测和发布事件之间可能存在延迟。

状态 LoadBalancerHealthEventType 严重性 说明 检测时段窗口 重新检测间隔 支持的属性
GA DataPathAvailabilityWarning 警告 当前端 IP 的数据路径可用性指标因平台问题小于 90% 时,会按受影响的负载均衡器前端 IP 发布此事件 1 分钟 5 分钟 前端 IP 地址,与受影响的负载均衡规则关联的前端端口列表
GA DataPathAvailabilityCritical 严重 当前端 IP 的数据路径可用性指标因平台问题小于 25% 时,会按受影响的负载均衡器前端 IP 发布此事件 1 分钟 5 分钟 前端 IP 地址,与受影响的负载均衡规则关联的前端端口列表
GA NoHealthyBackends 严重 当关联的后端池没有响应配置的运行状况探测的后端实例时,会根据负载均衡器前端 IP 发布此事件。 因此,负载均衡器没有用于将流量分发到的正常后端。 按需 60 分钟 前端 IP 地址,与受影响的负载均衡规则关联的协议和前端端口的成对列表
GA HighSnatPortUsage 警告 当后端实例通过单个前端 IP 利用的分配端口超过 75% 时,将在每个后端实例级别上发布此事件。 按需 5 分钟 后端 IP 地址,前端 IP 地址
GA SnatPortExhaustion 严重 此事件在每个后端实例级别发布。 当后端实例耗尽所有分配的端口,并使任何进一步的出站连接失败时,会发布事件。 此事件一直持续到端口被释放或更多端口被分配。 按需 5 分钟 后端 IP 地址,前端 IP 地址
GA ApproachingMaxRulesPerNicLimit 警告 如果一个或多个关联的后端实例总共配置了 300 多个负载均衡和入站 NAT 规则,则根据受影响的负载均衡器前端 IP 发布此事件。 24 小时 24 小时 前端 IP 地址
GA GatewayLoadBalancerNoHealthyBackends(网关负载均衡器没有健康的后端) 严重 如果存在因其后端实例未响应健康探测而无法访问的链式网关负载均衡器,则会针对每个受影响的负载均衡器前端 IP 发布此事件。 按需 60 分钟 前端 IP 地址
GA NetworkPlatformThrottlingActive 严重 当达到平台带宽和/或吞吐量限制时,此事件会根据发往此前端 IP 的流量按负载均衡器前端 IP 发布。 按需 60 分钟 前端 IP 地址

有关随每个运行状况事件日志发布的属性的详细信息,请参阅日志表 ALBHealthEvent的 Azure Log Analytics 参考文档。

后续步骤

在本文中,你了解了 Azure 负载均衡器运行状况事件日志和运行状况事件类型。

若要详细了解如何使用这些日志收集、分析和创建警报,并详细了解如何对每种运行状况事件类型进行故障排除,请参阅: