共用方式為


使用基礎模型微調訓練的用戶介面建立訓練運行

重要

這項功能在下列區域開放公開預覽centraluseastuseastus2northcentraluswestus

如何使用基礎模型微調(現在屬於 Mosaic AI 模型訓練的一部分)的 UI 來建立和配置訓練執行,本文章詳盡說明。 您也可以使用 API 建立回合。 如需說明,請參閱 使用基礎模型微調 API 建立訓練運行

需求

請參閱 需求

使用 UI 建立訓練回合

請遵循下列步驟,使用 UI 建立訓練回合。

  1. 在左側側邊欄中,按下[實驗]。

  2. [基礎模型微調] 卡片上,點擊[建立馬賽克 AI 模型實驗]

    基礎模型實驗表單

  3. 基礎模型微調 表單開啟。 必填項目以星號標示。 選擇完畢之後,按下[開始訓練]。

    類型:選取要執行的工作。

    任務 描述
    指令微調 使用提示和響應輸入繼續訓練基礎模型,以針對特定工作優化模型。
    持續預先訓練 繼續訓練基礎模型,為模型提供特定領域知識。
    對話完成 繼續使用聊天記錄來定型基礎模型,以針對問答或交談應用程式進行優化。

    選取基礎模型:選取要微調或定型的模型。 如需支援的模型清單,請參閱 支援的模型

    訓練數據:按兩下 [瀏覽 ] 以選取 Unity 目錄中的數據表,或輸入擁抱臉部數據集的完整 URL。 如需資料大小建議,請參閱建議模型訓練使用的資料大小

    如果您在 Unity 目錄中選取資料表,也必須選取要用來讀取資料表的計算。

    註冊至位置:從下拉功能表中選取 Unity 目錄和架構。 訓練完成的模型會儲存到這個位置。

    模型名稱:模型會以您指定的目錄和架構中儲存此名稱。 預設名稱會出現在這個欄位,您可視需要變更。

    進階選項:如需更多自訂,您可以設定可選的設置以進行評估、超參數微調或利用現有專有模型進行訓練。

    設定 描述
    訓練期間 訓練執行的時長,以 epochs(例如 10ep)或標記(例如 1000000tok)為單位指定。 預設值為 1ep
    學習率 模型訓練的學習速率。 所有模型都會使用AdamW優化器來訓練,並搭配學習速率預熱。 默認學習速率可能會因每個模型而有所不同。 建議您執行超參數搜尋,嘗試不同的學習速率和訓練時間,以取得最高品質的模型。
    上下文長度 資料範例的序列長度上限。 超過這個設定的資料會遭截斷。 預設值取決於選取的模型。
    評估資料 按兩下 [瀏覽 ] 以選取 Unity 目錄中的數據表,或輸入擁抱臉部數據集的完整 URL。 如果這個欄位留白,則不會執行任何評估。
    模型評估提示 輸入評估模型用的選擇性提示。
    實驗名稱 系統預設會為每回合指派自動產生的新名稱。 您可以選擇性地輸入自定義名稱,或從下拉式清單中選取現有的實驗。
    自訂權重 訓練預設會從使用所選模型的原始權數開始。 若要從微調 API 所產生的檢查點開始,請輸入包含檢查點的 MLflow 成品資料夾路徑。
    注意:如果您在 2025/3/26 之前定型模型,您將無法再從這些模型檢查點持續定型。 任何先前完成的定型執行仍可搭配布建的輸送量提供,而不會有問題。

下一步

訓練回合完成之後,您可以在 MLflow 檢閱計量及部署推斷模型。 請參閱教學課程:建立和部署基礎模型微調執行的步驟 5 到 7

如需了解資料準備、微調訓練運行配置和部署的指令微調範例,請參閱指令微調:具名實體辨識示範筆記本