你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure CycleCloud 是一套企业级友好的工具,用于协调和管理 Azure 上的高性能计算 (HPC) 环境。 使用 CycleCloud,可以为 HPC 系统预配基础结构、部署熟悉的 HPC 计划程序,并自动缩放基础结构以在任何规模高效运行作业。 通过 CycleCloud,可以创建不同类型的文件系统,并将其装载到计算群集节点以支持 HPC 工作负荷。
想要使用特定计划程序设置 HPC 环境的 HPC 管理员和用户使用 Azure CycleCloud。 它支持常用的计划程序,如 Slurm、PBSPro、LSF、网格引擎和 HT-Condor。 CycleCloud 是 Azure Batch 的妹妹产品,它提供计划程序作为 Azure 上的服务。
有关 CycleCloud 与其他 Azure HPC 解决方案的比较方式的信息,请参阅 Azure 上的高性能计算(HPC)。
为何使用 Azure CycleCloud?
具有长期 HPC 环境的组织通常围绕特定计划程序构建深入的专业知识和自定义工具。 在 Azure 上移动或重新设计这些配置可能会让人感到无所适从。 CycleCloud 简化了基本的 Azure 构建基块,例如虚拟机(VM)、规模集、网络接口和磁盘。 这种简化使 HPC 管理员能够专注于熟悉的内容:一个 HPC 群集,其中包含节点和计划程序,他们可以按其喜欢进行配置。
CycleCloud 将自动缩放插件添加到受支持的计划程序。 借助此功能,用户无需生成复杂的自动缩放例程。 他们直接使用他们已经知道的调度器设置。
CycleCloud 具有丰富的声明性模板化格式,提供强大的工具,用于在 Azure 上构建完整的 HPC 环境。 用户可以通过单个管理平面部署包括 NFS 服务器、并行文件系统、身份验证主机、许可证服务器和目录服务(实质上是 HPC 系统所需的所有组件)的环境。
CycleCloud 与 Azure 服务(例如 Azure Monitor 和 Microsoft 成本管理工具)集成。
CycleCloud 功能
| 能力 | 图像 |
|---|---|
|
与计划程序无关 使用标准 HPC 计划程序(如 Slurm、PBS Pro、LSF、网格引擎和 HTCondor)或扩展 CycleCloud 自动缩放插件来处理自己的计划程序 |
|
|
管理计算资源 管理虚拟机和规模集,以提供一组灵活的计算资源,以满足动态工作负荷要求 |
|
|
自动缩放资源 根据作业负载、可用性和时间要求自动调整群集大小和组件 |
|
|
监视和分析 使用可视化工具收集和分析性能数据 |
|
|
模板群集 使用 CycleCloud 模板与社区共享群集拓扑 |
|
|
自定义和扩展功能 使用综合 RESTful API 自定义和扩展功能,部署您自己的调度程序,并将其集成到现有的工作负载管理器中。 |
|
|
集成到现有工作流中 使用内置 CLI 集成到现有工作流和工具中 |
|
| 能力 | 图像 |
|---|---|
|
与计划程序无关 使用标准 HPC 计划程序(如 Slurm、PBS Pro、LSF、网格引擎和 HTCondor)或扩展 CycleCloud 自动缩放插件来处理自己的计划程序 |
|
|
管理计算资源 管理虚拟机和规模集,以提供一组灵活的计算资源,以满足动态工作负荷要求 |
|
|
自动缩放资源 根据作业负载、可用性和时间要求自动调整群集大小和组件 |
|
|
监视和分析 使用可视化工具收集和分析性能数据 |
|
|
模板群集 使用 CycleCloud 模板与社区共享群集拓扑 |
|
|
自定义和扩展功能 使用综合 RESTful API 自定义和扩展功能,部署您自己的调度程序,并将其集成到现有的工作负载管理器中。 |
|
|
集成到现有工作流中 使用内置 CLI 集成到现有工作流和工具中 |
|
如何使用 Azure CycleCloud?
Azure CycleCloud 是可在本地或 Azure VM 中运行的可安装 Web 应用程序。 安装后,可以将 CycleCloud 配置为在准备好的 Azure 订阅中使用计算和数据资源。 CycleCloud 为计划程序(PBSPro、LSF、网格引擎、Slurm、HTCondor)和文件系统提供了许多官方群集模板。 CycleCloud 社区还提供群集模板。 可以使用这些未修改的群集模板,或根据特定需求自定义这些模板。
创建群集时,它会自动缩放来处理发送到计划程序的计算作业。 CycleCloud 管理功能可控制组织中其他用户对 CycleCloud 群集的访问。
借助包含模板和配置脚本的工具,可以快速构建复杂的 HPC 环境,并为整个组织的不同团队复制这些设置。
CycleCloud 不能做什么
CycleCloud 不包括作业计划功能。 换句话说,CycleCloud 不是计划程序。 相反,它是一个平台,可用于部署和管理 Azure 的 HPC 资源。 CycleCloud 为多个常用计划程序提供内置支持,包括 PBSPro、Slurm、IBM LSF、网格引擎和 HTCondor。 但是,CycleCloud 还可以在提供的自动缩放 API 的基础上实现自己的计划程序。
CycleCloud 不会将你锁定到特定的群集拓扑中。 它包含的模板可帮助你快速在 Azure 上启动 HPC 系统,并且可以自定义这些模板以满足你的需求。 Azure HPC 社区提供针对不同类型的工作负荷和行业的优化模板。
CycleCloud 部署环境的外观
可以在 Azure 基础结构上部署整个 CycleCloud HPC 系统。 在 Azure 中需要出站访问 Azure 资源提供程序 API 的 VM 上安装 CycleCloud 作为应用程序服务器。 CycleCloud 启动和管理构成 HPC 系统的 VM。 这些 VM 通常包括计划程序头节点和计算节点。 还可以根据需要添加其他组件,例如 NFS 服务器、身份验证节点或堡垒主机。 可以在 CycleCloud 模板中定义完整的设置。 还可以连接到 Azure 服务,例如 NetApp 文件或 Microsoft Entra ID 服务。