你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
在生产环境中部署 Azure CycleCloud 之前,需要仔细规划基础结构、配置和作过程。 本文提供有关关键决策和要求的指导,以确保成功且可靠的 CycleCloud 部署。 它介绍初始设置、应用程序集成、数据管理和灾难恢复。
Azure CycleCloud 部署
- 选择要部署的 CycleCloud 版本:
- 通过为 CycleCloud 服务器部署选择订阅、虚拟网络、子网和资源组来准备 Azure 订阅
- 选择要托管群集的 资源组 ,或让 CycleCloud 创建资源组(默认设置)
- 创建用于保险箱访问的存储帐户
- 确定是否要使用 SSH 密钥、Microsoft Entra ID 或 LDAP 进行身份验证
- 确定 CycleCloud 是否应使用服务主体或托管标识(建议使用单个订阅) 在服务主体和托管标识之间进行选择
- 确认用于 CycleCloud 的 SKU: CycleCloud 系统要求
- 确定是否要在锁定的网络中部署环境。 如果是这样,请考虑以下要求: 在锁定的网络中运行
- 部署 CycleCloud 服务器
警告
在创建存储帐户期间,不要为 Azure Data Lake Storage Gen 2 设置“启用分层命名空间”。 CycleCloud 无法将启用了 ADLS Gen 2 的 Blob 存储服务用作存储锁定器。
Azure CycleCloud 配置
- 登录到 CycleCloud 服务器并创建站点和 CycleCloud 管理员帐户: CycleCloud 设置
- 创建指向存储帐户的 CycleCloud 保险箱
Azure CycleCloud 群集配置
- 定义对群集群集用户管理的用户访问权限
- 选择要使用的计划程序
- 选择任务调度器和主节点的版本
- 选择计算和执行节点的版本。 此选项完全取决于正在运行的应用程序。
- 决定是否使用模板部署群集,还是手动部署群集:
- 确定是否需要在调度程序上运行任何脚本,或者在部署后执行节点上的操作。
应用程序
- 应用程序具有哪些依赖项(库等) ? 如何使这些依赖项可用?
- 设置和安装应用程序需要多长时间? 此因素可能决定如何将应用程序提供给执行节点。 它可能还需要自定义映像。
- 是否需要考虑任何许可证依赖项? 应用程序是否需要联系本地许可证服务器?
- 将在何处执行应用程序? 此选项取决于安装时间和性能要求:
- 通过自定义映像:
- 使用市场映像
- 从 NFS 共享、Blob 存储、Azure NetApp 文件
- 是否需要使用特定的 VM 版本来运行应用程序? MPI 是否是必需的? 如果是,则需要不同的计算机系列,如 H 系列。
- 每个应用程序的每个作业的最大核心数是多少?
- 是否能够使用现成 VM? 在 CycleCloud 中使用现成 VM
- 请确保拥有正确的 订阅配额 ,以满足应用程序的核心要求。
数据
- 确定 Azure 中输入数据所在的位置。 此决定取决于应用程序和数据大小的性能。
- 在执行节点上本地运行
- 从 NFS 共享
- 在 Blob 存储中
- 使用 Azure NetApp 文件
- 确定输出数据是否需要任何后处理
- 确定处理完成后输出数据所在的位置
- 确定是否需要在其他位置复制输出数据
- 确定存档和备份要求
作业提交
- 用户如何提交作业?
- 用户是否有要在计划程序 VM 上运行的脚本,还是有一个前端来帮助数据上传和作业提交?
备份和灾难恢复
- 是否使用模板创建群集? 使用模板可以更快地重新创建 CycleCloud 服务器,并使部署保持一致。
- 灾难恢复要求是什么? 如果在你期望的时候 Azure 区域不可用,你的企业会受到什么影响?
- 内部业务是否定义了任何应用程序 SLA?
- 是否可以将另一个区域用作备用区域?
- 作业是否需要长时间运行? 检查点机制会有帮助吗?