随着时间的推移进行监视和优化
- 12 分钟
|
|
|---|
昨天重要的事情今天可能不重要。 随着你从生产环境中运行工作负载的过程中积累更多经验,要做好应对变化的准备。 你的设置、业务需求、工作流,甚至你的团队可能会改变。 可能需要调整生成和发布软件的方式。 外部因素(例如云平台及其资源以及你的协议)也可能会发生变化。
请留意更改对成本的影响。 定期签入以查看你的投资回报(ROI)是否正向正确的方向发展,并根据需要调整目标或要求。
示例场景
Contoso Air 为航空公司提供行李跟踪解决方案。 工作负荷托管在 Azure 中,在 Azure Kubernetes 服务(AKS)中运行,Azure Cosmos DB 作为其数据库运行,并使用 Azure 事件中心进行消息传送。 工作负荷部署在美国西部和美国东部区域。
跟踪和监视支出
使用成本跟踪系统定期查看你在资源、数据和支持方面的支出。 如果资源使用不足,请考虑将其关闭、替换资源或重新工作以提高效率。
了解资金的去向是控制资金的第一步。 通过标记资源、分类费用和设置警报,可以跟踪团队、服务和环境的支出。
这种可见性有助于你及早发现意外费用、支持成本展示或成本回收模式,并就削减开支或投资方向做出更明智的决策。
Contoso 的挑战
工作负荷团队一直处于预算之下,因此降低成本并不是一个重点。
但明年,他们计划提高工作负荷的可靠性,这意味着 Azure 成本更高。 这可能会让他们超出预算,所以他们正在考虑要求增加预算,以弥补超支。
应用方法和结果
在团队要求更多预算之前,他们决定仔细查看当前的 Azure 和支持成本,看看是否有任何可节省的空间。 他们使用成本跟踪系统深入了解资源、资源组和标记的成本明细。 他们发现意外的支出。
团队发现,某些虚拟机(VM)仍在运行,这些虚拟机仍用于不再需要的旧生成系统。 还有位于 Azure 存储中的旧数据,可以迁移到更便宜的储存层级。 此外,他们还为包含咨询时长的支持合同支付了费用,但一直未曾使用这些咨询服务。
该团队通过删除未使用的 VM 并将旧数据移至存档存储来优化其 Azure 成本。 他们开始与云提供商更密切地合作,以充分利用其咨询服务。
他们添加一个重复性任务到他们的待办事项,以便定期查看和优化其未来的工作负荷成本。
持续优化工作负荷
根据 ROI 数据不断调整体系结构设计决策、资源、代码和工作流。
云环境会不断发展,体系结构也是如此。 定期查看指标、性能、计费和功能使用情况。 你可能会发现小调整,节省资金,使事情运行更顺利。 即使是较小的调整,随着时间积累,也能实现很大的节省。
Contoso 的挑战
由于团队在历史上一直处于预算之下,因此他们没有研究其他方法来做事。 相反,他们的大部分规划都侧重于构建新功能。
但在首次成本审查期间发现浪费后,他们决定仔细研究其余设置,以找到更多优化方法。
应用方法和结果
团队意识到,他们正在将过多的资源投入到低优先级流中。 它们可以缩减吞吐量,而不会中断性能。 他们不会为了高峰时段做过度准备,而是将切换到基于队列的负载均衡系统。
他们还注意到,他们的计算平台现在在其所选 SKU 中包含一项新功能,用于替换某些身份验证代码。 使用此功能意味着要维护和测试的代码更少。
持续优化云环境
习惯是定期检查云设置中未使用的资源或旧数据并将其删除。 随着时间的推移,这些曾经有用的组件可能会保留下来,并悄悄地累积成本。 使环境保持优化,以帮助保持高效并节省资金。
关闭未使用的资源并删除不需要的数据,以释放预算,用于完成更重要的工作。
Contoso 的挑战
在过去的一年里,团队创建了几个临时环境,用于测试新功能和运行性能试验。 其中许多环境从未清理过。
他们发现了多个事件中心命名空间和 Azure Cosmos DB 容器,这些容器在几个月内未收到任何流量,但仍会产生存储和吞吐量成本。
来自以往航空合作伙伴的旧行李追踪数据仍存储在热访问层级中,尽管这些数据已不再用于运营或合规工作。
团队缺乏识别和清理未使用资源的常规流程,因此杂乱无序继续在不被注意的情况下积累。
应用方法和结果
该团队设置了每月清理例程,其中包括使用过期日期标记资源,并查看使用指标来标记空闲服务。
他们可以解除未使用的 AKS 节点池、删除非活动事件中心,并尽可能合并 Azure Cosmos DB 容器。
对于历史行李数据,它们实施生命周期策略,根据年龄和访问模式自动存档或删除数据。
他们还审查他们的资源 SKU,并对过度预配的服务进行降级。
这些作有助于他们减少不必要的支出,提高运营效率,并使其云环境保持干净且易于管理。