你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure Monitor 问题和调查(预览版)

Azure Monitor 问题与调查(预览版)是 AIOps 功能,可自动执行针对 Azure Monitor 警报的故障排除流程。 可观测性代理是 AI 支持的系统,用于调查问题并生成发现,以帮助解决 Azure 资源的问题。

本文介绍了如何使用 Azure Monitor 问题与调查(预览版)对 Azure 资源问题进行分类和缓解。

什么是问题?

问题代表对与服务相关问题的整体性视图,提供了用于管理事件的结构化框架。 它使用 AI 进行自动化分析和诊断过程,通过所有可观测性相关数据提供高质量的见解,以便快速准确地排查服务运行状况下降问题。

问题概述了、调查、有关警报的详细信息以及所涉及的资源。

可以设置问题的严重性、状态和影响时间。

问题的屏幕截图。

什么是调查?

调查是由 可观测代理 执行的分析,该代理在问题的上下文中生成结果。 可观测性代理使用基于 AI 的迭代会审和诊断过程来最大程度地减少手动工作量,实现更快、更准确的故障排除。

仅显示最新的调查。 用户可以编辑范围和影响时间,并触发可观测性代理来运行新的调查。 可观测性代理从问题影响时间开始扫描最多两个小时的遥测数据。

调查结果

发现可识别异常行为,这些行为可以解释服务资源的问题。 它们根据相关信号(指标、日志等)汇总了对多个异常的分析(例如,“VM 性能较低,因为可能存在内存泄漏”),并可能建议进一步调查步骤和潜在缓解措施。

结果的摘要可以包括:

  • 发生了什么情况? 有关调查结果的说明以及调查中包含的资源。
  • 可能的解释。 针对具体发现和相关支持数据,描述可能导致问题的原因。
  • 后续步骤。 有关继续调查或缓解问题的建议。
  • 辅助数据。 支持数据是证明查找合理性的信息,例如异常、诊断见解、运行状况数据、资源更改、相关资源和相关警报。

注释

最多显示五个结果,所有其他异常将分组到 其他数据中。

支持用于查找的数据类型

指标异常说明

除了检测异常之外,还基于指标维度(例如异常的特定区域或错误代码)创建说明。

指标异常的屏幕截图。

应用程序日志分析

可观测性代理会扫描应用程序日志中的异常情况。 分析前三个故障事件(对于依赖项、请求和异常)。 对于每个事件:

  • 说明:为失败生成所发生情况的说明。
  • 事务示例:存在特定故障事件的事务示例列表。 选择该示例会在 Application Insights 中显示端到端事务。
  • 异常:如果存在与故障相关的特定异常问题标识符(ID),则会在日志中显示其出现次数。 问题 ID 以自然语言解释,并提供了一个示例。
  • 事务模式:如果失败存在特定的事务模式,则会显示该模式。 此信息有助于说明问题并显示根本原因。 如果有多个事务模式,则不显示任何模式。
  • 跟踪消息模式:如果存在与故障相关的特定跟踪消息模式,它们会在日志中显示出现次数。 这些模式以自然语言进行说明,并提供了一个示例。

应用程序异常的屏幕截图。

诊断见解

提供基于 Azure 支持最佳实践,从异常遥测中获取的可操作的解决方案和诊断,从而增强问题解决效率。

诊断和故障排除的屏幕截图。

包含过去 15 分钟内发生的、针对问题范围资源的相关高严重性警报的数据。 这些警报会同步回问题,并显示在“警报”选项卡中。

相关警报的屏幕截图。

资源运行状况

提供 来自 Azure 资源运行状况 的事件数据,说明调查期间资源运行状况下降的情况。

能力

可配置的范围

可观测性代理根据调查范围提出关于要分析哪些资源的建议。 默认范围包括资源的所有指标。 可以更改范围以包含最多五个资源。 请参阅使用问题和调查中的“确定调查范围”。

智能范围

可观测性代理还提供 Application Insight 资源的智能范围。 在这种情况下,可以通过查看正在运行服务的依赖项和基础结构来自动识别可能的可疑资源,然后在分析中包括这些资源。 此过程出现在调查过程中,结果会同步到问题。

智能范围的屏幕截图。

问题和调查初始工作流示例

  1. 收到来自 Azure Monitor 的警报电子邮件。
  2. 选择电子邮件中的“调查”按钮会创建问题并启动可观测性代理调查。 Azure 门户中的问题页将在浏览器中打开。
  3. 在“问题”页上,你会看到:
    • 问题概述:最后一次调查的发现以及总结的支持数据都在此呈现。
    • 每个发现都包含可观测代理分析摘要、建议执行的作以及用于分析的支持数据。
  4. 观测性代理生成的每个发现都提供了有关潜在原因的更多详细信息,并提供了可供选择的后续步骤。

区域

对于问题和调查服务,这些区域是受支持的 Azure 区域:

公共预览区域可用性
australiacentral
australiaeast
australisoutheast
巴西南部
canadacentral
加拿大东部
centralindia
centralus
智利中部
eastasia
eastus
eastus2
eastus2euap
francecentral
germanywestcentral
indonesiacentral
以色列中心
italynorth
japaneast
日本西部
koreacentral
koreaSouth
马来西亚西部
墨西哥中心
新西兰北部
northcentralus
northeurope
northwayeast
polandcentral
southafricanorth
southcentralus
southindia
southeastasia
spaincentral
swedencentral
瑞典南部
瑞士北部
uaenorth
uksouth
ukwest
westcentralus
欧洲西部
westus
westus2
westus3

后续步骤