簡介
Azure CycleCloud 可讓您在 Azure 中自定義和管理高效能運算 (HPC) 叢集。
案例
Contoso 是一家位於德克薩斯州休斯頓的海洋和氣象服務公司。 Contoso 的研究團隊高度依賴其本地部署的 HPC 叢集來執行 Slurm 型作業。
最新起始的專案牽涉到數個模擬,其將追蹤在暴風雨季節期間穿越美國墨西哥灣沿岸地區的暴風雨。 可惜的是,初始評量判斷現有的內部部署 HPC 叢集沒有足夠的計算容量來執行模擬。
身為首席研究工程師,您已使用 Contoso 的現有 Azure 訂用帳戶在 Azure 中布建新的 HPC 叢集。 為了簡化布建程式,您已實作 Azure CycleCloud,並用它來部署新的叢集。
現在,您必須自定義部署,以針對新專案進行優化。 您具有在內部部署 HPC 環境中使用的現有自訂映像和指令碼。 您想要在布建排程器和計算節點時重複使用這些映像和腳本。 您也會探索可簡化部署程式的選項,因為您計劃設定相符的開發與生產叢集。 您打算使用 Azure CycleCloud 的功能來完成這些目標。
我們要做什麼?
您將開始此模組,藉由使用自定義的 Azure CycleCloud 範本來測試實作叢集的過程。 為此,您將從 Azure CycleCloud 範本 GitHub 存放庫下載現有的範本、變更範本中的記憶體組態定義、匯入新修改的範本,以及使用 Azure CycleCloud 圖形化介面來建立叢集。
接下來,您將使用相同的範本在叢集定義中新增額外的 nodearray 和分割區,確定對應的叢集資源可透過 Azure CycleCloud Web 介面進行設定、導出新部署叢集的屬性、使用新設定更新它,以及匯入修改過的範本,將其組態套用至現有的叢集。
最後,您將實作 cloud-init 腳本,以搭配 Azure CycleCloud 使用。 您必須先將腳本新增至排程器和計算節點,然後啟動叢集以確認 cloud-init 變更是否已發生。
主要目標是什麼?
在本課程模組結束時,您將深入瞭解如何使用 Azure CycleCloud 範本自定義在 Azure 中執行的 HPC 叢集架構。 您也將瞭解如何使用 cloud-init 腳本來修改叢集節點的設定。