你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文讨论 Azure 数字孪生服务的高可用性 (HA) 和灾难恢复 (DR) 功能,包括区域内 HA 和跨区域 DR。 本文还介绍了如何监视服务运行状况。
进行业务连续性和灾难恢复考虑有助于创建可复原的 IoT 解决方案,而为 HA 和 DR 进行设计有助于为 Azure 数字孪生解决方案定义和实现适当的运行时间目标。
Azure 数字孪生支持以下功能:
- 区域内部 HA – 内置冗余,可实现服务运行时间
- 跨区域灾难恢复 - 在数据中心出现意外故障时故障转移到配对的 Azure 区域
区域内部 HA
Azure 数字孪生通过在服务内实现冗余来提供区域内部 HA。 服务 SLA 的运行时间反映了此功能。 Azure 数字孪生解决方案的开发人员可以利用这些 HA 功能,而无需任何额外的工作。
尽管 Azure 数字孪生提供很高的运行时间保证,但暂时性的故障仍有可能出现在任何分布式计算平台上。 应该在与云应用程序交互的组件中内置相应重试策略,以处理这些暂时性故障。
跨区域 DR
尽管数据中心不太可能因电源故障或区域中的其他事件而经历过长时间的中断,但这种可能性仍然存在。 在此类罕见的故障事件中,前面所述的区域内 HA 功能可能不够。 Azure 数字孪生通过 Microsoft 发起的故障转移解决这种问题。
在少数情况下,会执行 Microsoft 发起的故障转移,将所有 Azure 数字孪生实例从受影响的区域故障转移到对应的配对区域。 此过程是默认选项,无需你进行任何干预,这意味着默认将存储在 Azure 数字孪生中的客户数据复制到配对区域。 Microsoft 保留决定何时执行此选项的权利,此机制在用户的实例进行故障转移之前不涉及用户同意。
如果有必要将所有数据保留在某些地理区域内,请检查要在其中创建实例的区域的 配对区域 的位置,以确保它满足数据驻留要求。 对于有内置数据驻留要求的区域,客户数据始终保存在同一区域内。
注意
某些 Azure 服务提供另一种称为 客户启动故障转移的选项,使客户能够仅为实例启动故障转移,例如运行 DR 演练。 Azure 数字孪生目前不支持此机制。
其他 Azure 服务为用户提供了一个配置不同故障转移区域的选项,以此满足数据驻留要求。 Azure 数字孪生不支持此功能。
监视服务运行状况
故障转移和恢复 Azure 数字孪生实例时,可以使用 Azure 服务运行状况工具监视此过程。 服务运行状况跨不同区域和订阅跟踪 Azure 服务的运行状况,并共享有关服务中断和故障时间的服务影响通信。
在故障转移事件期间,服务运行状况可指示服务关闭时间和备份时间。
查看服务运行状况事件...
导航到 Azure 门户中的服务运行状况(可使用此链接,也可以在门户搜索栏中搜索它)。
使用左侧菜单切换到“运行状况历史记录”页。
查找以“Azure 数字孪生”开头的问题名称,并选择它。
有关该服务中断的一般信息,请查看“摘要”选项卡。
有关一段时间内问题的详细信息和更新,请查看“问题更新”选项卡。
此工具中显示的信息不特定于一个 Azure 数字孪生实例。 使用服务运行状况了解某个区域或订阅中 Azure 数字孪生服务的运行状况后,可以通过使用 Azure 资源运行状况向下钻取到特定实例并查看这些实例是否受影响,来实施进一步监视。
后续步骤
阅读以下 Azure 文章中有关 HA/DR 的常规最佳做法:
- 可靠性的设计评审清单 描述了一个常规框架,可帮助你考虑业务连续性和灾难恢复。
- 有关设计灾难恢复策略的建议 提供了有关 Azure 应用程序实现高可用性(HA)和灾难恢复(DR)的策略的体系结构指导。