你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure SRE 智能体预览版概述

Azure SRE 代理可自动执行作工作并减少工作,因此开发人员和操作员可以专注于高价值任务。

典型的作任务通常包括管理多个 Azure 资源以及本地和 SaaS 系统。 这些任务通常是重复的,或者需要协调多个工具来提供所需的见解。 SRE 代理提供 AI 驱动的平台,用于将系统连接在一起,并自动化工作流端到端。

什么是 SRE 代理?

SRE 代理是一项将自动化和智能引入站点可靠性工程实践的服务。 它可帮助你减少手动工作量、改善系统运行时间,并提供一致的作结果。 当代理与 Azure 服务和外部系统集成时,它就执行操作任务,只需最少人工干预。

Azure 服务管理功能

SRE 代理可以通过 Azure CLI 和 REST API 管理所有 Azure 服务。 此功能包括对以下项的全面支持:

  • 计算服务:虚拟机、应用服务、容器应用、Azure Kubernetes 服务(AKS)、Azure Functions 等

  • 存储服务:Blob 存储、文件共享、托管磁盘和存储帐户

  • 网络服务:虚拟网络、负载均衡器、应用程序网关和网络安全组

  • 数据库服务:Azure SQL 数据库、Cosmos DB、PostgreSQL、MySQL 和 Redis

  • 监视和管理:Azure Monitor、Log Analytics、Application Insights 和 Resource Manager

可以通过使用自定义运行簿和 子代理,通过 SRE Agent 自动化执行 Azure CLI 的任何操作。

主要用例

  • 自动化事件管理:连接到事件管理平台,以自动化分类、缓解和解决。 此连接可缩短恢复时间(MTTR),并提高服务可用性。

  • 自动执行计划的工作流:设置主动警报和操作,以自动化根据定义好的计划运行的例行任务和重复任务。

若要查看 SRE 代理的实际操作,请观看以下视频。


SRE 代理的工作原理是什么?

SRE 代理将微调的 Azure 专业知识与完整的自定义功能相结合。 开箱即用,SRE 代理可了解并管理特定服务的 Azure 资源。 它为常见作任务提供智能默认值。 同时,它可以灵活地整合领域特定知识、自定义操作手册,以及与工具和数据源,例如可观察性和监控平台的集成。

代理通过多个自动化机制运行,包括:

  • 内置 Azure 知识:对 Azure 服务的预配置理解,具备优化的操作模式

  • 自定义 Runbook:对任何 Azure 服务执行 Azure CLI 命令和 REST API 调用

  • 子代理扩展性:为特定服务(如 VM、数据库或网络组件)生成专用代理

  • 外部集成:连接到监视、事件管理和源代码管理系统

这种扩展性可确保 SRE 代理能够适应整个 Azure 基础结构中的环境和作要求。

集成

Azure SRE 代理通过以下方式与运营生态系统集成:

  • 监视和可观测性:

    • Azure Monitor (指标、日志、警报、工作簿)
    • Application Insights
    • Log Analytics
    • Grafana
  • 事件管理:

    • Azure Monitor 警报
    • PagerDuty
    • ServiceNow
  • 源代码管理和 CI/CD:

    • GitHub (存储库, 问题)
    • Azure DevOps(存储库、工作项)
  • 数据源

    • Azure 数据资源管理器 (Kusto) 群集
    • 模型上下文协议 (MCP) 服务器

开始

通过计划任务、处理事件或生成子代理,开始使用 Azure SRE 代理。

创建一个根据您定义的时间表运行的计划任务。

  1. 选择“ 计划任务 ”选项卡。

  2. 输入任务详细信息。

  3. 定义运行任务的计划。

  4. 为任务创建自定义代理说明。

  5. 选择“ 创建计划任务”。

Considerations

使用 Azure SRE 代理时,请记住以下注意事项:

  • 英语是聊天界面中唯一支持的语言。
  • 有关如何在 Azure SRE 代理中管理数据的详细信息,请参阅 Microsoft隐私策略
  • 可用性因区域和租户配置而异。

创建代理时,还会自动创建以下资源:

  • Azure Application Insights
  • Log Analytics 工作区
  • 托管标识

后续步骤