共用方式為


規劃 CycleCloud 生產部署

在生產環境中部署 Azure CycleCloud 之前,您必須仔細規劃基礎結構、設定和作業程式。 本文提供重要決策和需求指引,以確保成功且可靠的 CycleCloud 部署。 其涵蓋初始設定、應用程式整合、數據管理和災害復原。

Azure CycleCloud 部署

警告

在建立記憶體帳戶期間,請勿為 Azure Data Lake Storage Gen 2 設定「啟用階層命名空間」。 CycleCloud 無法使用已啟用 ADLS Gen 2 的 Blob 記憶體作為記憶體保險箱。

Azure CycleCloud 組態

Azure CycleCloud 叢集組態

  • 定義使用者對叢集的存取權限 叢集使用者管理
  • 選擇要使用的排程器
  • 選擇排程器和前端節點的版本
  • 選擇計算和執行節點的版本。 這個選擇完全取決於您正在執行的應用程式。
  • 決定是否要使用範本或手動部署叢集:
  • 決定是否需要在排程器上執行任何腳稿,或在部署後執行節點:

應用程式

  • 應用程式有哪些相依性(連結庫等等) ? 如何讓這些依賴可用?
  • 設定及安裝應用程式需要多久時間? 此因素可能會決定如何將應用程式提供給執行節點。 它也可能需要自定義映像。
  • 您是否需要考慮任何授權相依性? 應用程式是否需要連絡內部部署授權伺服器?
  • 您要在何處執行應用程式? 這個選擇取決於安裝時間和效能需求:
  • 您是否需要使用特定的 VM 版本,讓應用程式執行? MPI 是否為需求? 如果是,您將需要不同的機器系列,例如 H 系列。
  • 每個應用程式的最佳作業核心數是多少?
  • 您可以使用現成 VM 嗎? 在 CycleCloud 中使用現成 VM
  • 請確定您有正確的訂用帳戶 配額 ,以符合應用程式的核心需求。

資料

  • 判斷 Azure 輸入數據所在的位置。 此判斷取決於應用程式和數據大小的效能。
    • 在執行節點本地端上
    • 從 NFS 共用
    • 在 Blob 儲存體中
    • 使用 Azure NetApp 檔案
  • 判斷輸出數據是否需要任何後續處理
  • 決定輸出數據在處理完成之後所在的位置
  • 決定輸出數據是否需要複製到其他地方
  • 判斷封存和備份需求

作業提交

  • 使用者如何提交作業?
  • 使用者是否有腳本在排程器 VM 上執行,或是否有前端可協助數據上傳和作業提交?

備份和災害復原

  • 您是否會使用範本建立叢集? 使用範本可讓 CycleCloud 伺服器更快速地重新建立,並讓部署保持一致。
  • 您的災害復原需求為何? 如果您預期無法使用 Azure 區域,您的企業會發生什麼事?
  • 您的內部企業是否定義了任何應用程式 SLA?
  • 您是否可以使用另一個區域作為待命區域?
  • 您的作業是否會長時間執行? 檢查點有幫助嗎?