在生產環境中部署 Azure CycleCloud 之前,您必須仔細規劃基礎結構、設定和作業程式。 本文提供重要決策和需求指引,以確保成功且可靠的 CycleCloud 部署。 其涵蓋初始設定、應用程式整合、數據管理和災害復原。
Azure CycleCloud 部署
- 選擇要部署的 CycleCloud 版本:
- 準備您的 Azure 訂用帳戶,首先選擇 CycleCloud 伺服器部署所需的訂用帳戶、虛擬網路、子網和資源群組。
- 選擇 資源群組 來裝載叢集,或讓 CycleCloud 建立資源群組 (預設設定)
- 建立用於保險箱存取的記憶體帳戶
- 決定是否要使用 SSH 金鑰、Microsoft Entra ID 或 LDAP 進行 驗證
- 決定 CycleCloud 是否應該使用服務主體或受控識別(建議使用單一訂用帳戶) 在服務主體與受控識別之間選擇
- 確認用於 CycleCloud 的 SKU: CycleCloud 系統需求
- 決定是否要在鎖定的網路中部署環境。 如果是,請考慮下列需求:在受限制的網路中運行
- 部署 CycleCloud 伺服器
警告
在建立記憶體帳戶期間,請勿為 Azure Data Lake Storage Gen 2 設定「啟用階層命名空間」。 CycleCloud 無法使用已啟用 ADLS Gen 2 的 Blob 記憶體作為記憶體保險箱。
Azure CycleCloud 組態
- 登入 CycleCloud 伺服器並建立網站和 CycleCloud 系統管理員帳戶: CycleCloud 設定
- 建立連接到儲存體帳戶的 CycleCloud 保險箱
Azure CycleCloud 叢集組態
- 定義使用者對叢集的存取權限 叢集使用者管理
- 選擇要使用的排程器
- 選擇排程器和前端節點的版本
- 選擇計算和執行節點的版本。 這個選擇完全取決於您正在執行的應用程式。
- 決定是否要使用範本或手動部署叢集:
- 決定是否需要在排程器上執行任何腳稿,或在部署後執行節點:
應用程式
- 應用程式有哪些相依性(連結庫等等) ? 如何讓這些依賴可用?
- 設定及安裝應用程式需要多久時間? 此因素可能會決定如何將應用程式提供給執行節點。 它也可能需要自定義映像。
- 您是否需要考慮任何授權相依性? 應用程式是否需要連絡內部部署授權伺服器?
- 您要在何處執行應用程式? 這個選擇取決於安裝時間和效能需求:
- 透過自定義映像:
- 使用市集影像
- 從 NFS 共用、Blob 儲存體、Azure NetApp 檔案
- 您是否需要使用特定的 VM 版本,讓應用程式執行? MPI 是否為需求? 如果是,您將需要不同的機器系列,例如 H 系列。
- 每個應用程式的最佳作業核心數是多少?
- 您可以使用現成 VM 嗎? 在 CycleCloud 中使用現成 VM
- 請確定您有正確的訂用帳戶 配額 ,以符合應用程式的核心需求。
資料
- 判斷 Azure 輸入數據所在的位置。 此判斷取決於應用程式和數據大小的效能。
- 在執行節點本地端上
- 從 NFS 共用
- 在 Blob 儲存體中
- 使用 Azure NetApp 檔案
- 判斷輸出數據是否需要任何後續處理
- 決定輸出數據在處理完成之後所在的位置
- 決定輸出數據是否需要複製到其他地方
- 判斷封存和備份需求
作業提交
- 使用者如何提交作業?
- 使用者是否有腳本在排程器 VM 上執行,或是否有前端可協助數據上傳和作業提交?
備份和災害復原
- 您是否會使用範本建立叢集? 使用範本可讓 CycleCloud 伺服器更快速地重新建立,並讓部署保持一致。
- 您的災害復原需求為何? 如果您預期無法使用 Azure 區域,您的企業會發生什麼事?
- 您的內部企業是否定義了任何應用程式 SLA?
- 您是否可以使用另一個區域作為待命區域?
- 您的作業是否會長時間執行? 檢查點有幫助嗎?