你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure SRE 代理可自动执行作工作并减少工作,因此开发人员和操作员可以专注于高价值任务。
典型的作任务通常包括管理多个 Azure 资源以及本地和 SaaS 系统。 这些任务通常是重复的,或者需要协调多个工具来提供所需的见解。 SRE 代理提供 AI 驱动的平台,用于将系统连接在一起,并自动化工作流端到端。
什么是 SRE 代理?
SRE 代理是一项将自动化和智能引入站点可靠性工程实践的服务。 它可帮助你减少手动工作量、改善系统运行时间,并提供一致的作结果。 当代理与 Azure 服务和外部系统集成时,它就执行操作任务,只需最少人工干预。
Azure 服务管理功能
SRE 代理可以通过 Azure CLI 和 REST API 管理所有 Azure 服务。 此功能包括对以下项的全面支持:
计算服务:虚拟机、应用服务、容器应用、Azure Kubernetes 服务(AKS)、Azure Functions 等
存储服务:Blob 存储、文件共享、托管磁盘和存储帐户
网络服务:虚拟网络、负载均衡器、应用程序网关和网络安全组
数据库服务:Azure SQL 数据库、Cosmos DB、PostgreSQL、MySQL 和 Redis
监视和管理:Azure Monitor、Log Analytics、Application Insights 和 Resource Manager
可以通过使用自定义运行簿和 子代理,通过 SRE Agent 自动化执行 Azure CLI 的任何操作。
主要用例
自动化事件管理:连接到事件管理平台,以自动化分类、缓解和解决。 此连接可缩短恢复时间(MTTR),并提高服务可用性。
自动执行计划的工作流:设置主动警报和操作,以自动化根据定义好的计划运行的例行任务和重复任务。
若要查看 SRE 代理的实际操作,请观看以下视频。
SRE 代理的工作原理是什么?
SRE 代理将微调的 Azure 专业知识与完整的自定义功能相结合。 开箱即用,SRE 代理可了解并管理特定服务的 Azure 资源。 它为常见作任务提供智能默认值。 同时,它可以灵活地整合领域特定知识、自定义操作手册,以及与工具和数据源,例如可观察性和监控平台的集成。
代理通过多个自动化机制运行,包括:
内置 Azure 知识:对 Azure 服务的预配置理解,具备优化的操作模式
自定义 Runbook:对任何 Azure 服务执行 Azure CLI 命令和 REST API 调用
子代理扩展性:为特定服务(如 VM、数据库或网络组件)生成专用代理
外部集成:连接到监视、事件管理和源代码管理系统
这种扩展性可确保 SRE 代理能够适应整个 Azure 基础结构中的环境和作要求。
集成
Azure SRE 代理通过以下方式与运营生态系统集成:
监视和可观测性:
- Azure Monitor (指标、日志、警报、工作簿)
- Application Insights
- Log Analytics
- Grafana
事件管理:
- Azure Monitor 警报
- PagerDuty
- ServiceNow
源代码管理和 CI/CD:
- GitHub (存储库, 问题)
- Azure DevOps(存储库、工作项)
数据源:
- Azure 数据资源管理器 (Kusto) 群集
- 模型上下文协议 (MCP) 服务器
开始
通过计划任务、处理事件或生成子代理,开始使用 Azure SRE 代理。
创建一个根据您定义的时间表运行的计划任务。
选择“ 计划任务 ”选项卡。
输入任务详细信息。
定义运行任务的计划。
为任务创建自定义代理说明。
选择“ 创建计划任务”。
Considerations
使用 Azure SRE 代理时,请记住以下注意事项:
- 英语是聊天界面中唯一支持的语言。
- 有关如何在 Azure SRE 代理中管理数据的详细信息,请参阅 Microsoft隐私策略。
- 可用性因区域和租户配置而异。
创建代理时,还会自动创建以下资源:
- Azure Application Insights
- Log Analytics 工作区
- 托管标识