你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

规划 CycleCloud 生产部署

在生产环境中部署 Azure CycleCloud 之前,需要仔细规划基础结构、配置和作过程。 本文提供有关关键决策和要求的指导,以确保成功且可靠的 CycleCloud 部署。 它介绍初始设置、应用程序集成、数据管理和灾难恢复。

Azure CycleCloud 部署

警告

在创建存储帐户期间,不要为 Azure Data Lake Storage Gen 2 设置“启用分层命名空间”。 CycleCloud 无法将启用了 ADLS Gen 2 的 Blob 存储服务用作存储锁定器。

Azure CycleCloud 配置

Azure CycleCloud 群集配置

  • 定义对群集群集用户管理的用户访问权限
  • 选择要使用的计划程序
  • 选择任务调度器和主节点的版本
  • 选择计算和执行节点的版本。 此选项完全取决于正在运行的应用程序。
  • 决定是否使用模板部署群集,还是手动部署群集:
  • 确定是否需要在调度程序上运行任何脚本,或者在部署后执行节点上的操作。

应用程序

  • 应用程序具有哪些依赖项(库等) ? 如何使这些依赖项可用?
  • 设置和安装应用程序需要多长时间? 此因素可能决定如何将应用程序提供给执行节点。 它可能还需要自定义映像。
  • 是否需要考虑任何许可证依赖项? 应用程序是否需要联系本地许可证服务器?
  • 将在何处执行应用程序? 此选项取决于安装时间和性能要求:
  • 是否需要使用特定的 VM 版本来运行应用程序? MPI 是否是必需的? 如果是,则需要不同的计算机系列,如 H 系列。
  • 每个应用程序的每个作业的最大核心数是多少?
  • 是否能够使用现成 VM? 在 CycleCloud 中使用现成 VM
  • 请确保拥有正确的 订阅配额 ,以满足应用程序的核心要求。

数据

  • 确定 Azure 中输入数据所在的位置。 此决定取决于应用程序和数据大小的性能。
    • 在执行节点上本地运行
    • 从 NFS 共享
    • 在 Blob 存储中
    • 使用 Azure NetApp 文件
  • 确定输出数据是否需要任何后处理
  • 确定处理完成后输出数据所在的位置
  • 确定是否需要在其他位置复制输出数据
  • 确定存档和备份要求

作业提交

  • 用户如何提交作业?
  • 用户是否有要在计划程序 VM 上运行的脚本,还是有一个前端来帮助数据上传和作业提交?

备份和灾难恢复

  • 是否使用模板创建群集? 使用模板可以更快地重新创建 CycleCloud 服务器,并使部署保持一致。
  • 灾难恢复要求是什么? 如果在你期望的时候 Azure 区域不可用,你的企业会受到什么影响?
  • 内部业务是否定义了任何应用程序 SLA?
  • 是否可以将另一个区域用作备用区域?
  • 作业是否需要长时间运行? 检查点机制会有帮助吗?