共用方式為


Microsoft 365 Copilot 微調概觀 (預覽)

Microsoft 365 Copilot 微調可讓組織使用自己的租戶資料來微調大型語言模型 (LLM) 。 這些微調的模型為代理提供動力,這些 代理 可以根據組織的獨特知識執行特定領域的任務。 所有定型和 AI 處理都會在您的 Microsoft 365 租用戶內進行,因此您的數據會保持安全,並受現有合規性控制項控管。 結果是一個人工智慧助理,其行為就像專家團隊成員一樣,根據您組織的內容和規則提供量身定制的幫助。

本文說明組織如何使用 Copilot 微調來建立特定於任務的微調 LLM。 它涵蓋了使用者如何在這些微調模型上建立代理程式,以及 IT 管理員如何控管該功能。

注意事項

Copilot 微調目前適用於早期Access 預覽版 (EAP) 。 如需相關需求和註冊方式的詳細資訊,請參閱 管理員指南

主要功能和案例

Copilot 微調允許通過直觀的無代碼 UI 微調 LLM。 業務分析師或主題專家可以使用他們的領域知識來微調相關租戶資料的 LLM,使模型能夠學習組織自訂的獨特聲音和程序。 例如,法律部門分析師可以使用公司過去的案例摘要和模板微調模型,以創建合同起草代理,使用公司獨特的風格和術語編寫文件。

Copilot 微調提供下列主要功能和優點:

  • 無程式碼模型微調 - 使用 Microsoft Copilot Studio 中的直覺式介面,微調內部資料的 LLM。

  • 領域特定代理程式 - 根據針對業務任務量身打造的微調模型來建置專門的 Copilot 代理程式。 您可以為專家問答&A、提案產生或報告摘要等案例建立代理程式,這些案例的行為類似於該領域的專家。 代理程式會以適當的語氣、詞彙和詳細程度來產生結果,適合組織。

  • 更直覺的深入解析和自動化 - 將組織的商務專業知識編碼到 Copilot 中,可讓您針對組織進行調整的分析和內容建立。 可能需要數天手動工作 (搜索文檔、編譯數據、編寫草稿) 的任務由代理在幾分鐘內完成。 這種自動化可讓您的分析師和主題專家專注於更高價值的工作,而 Copilot 則處理日常或資訊密集型任務。

  • 與資料來源整合 - Copilot 微調可以使用 Microsoft 365 生態系統中已有的豐富內容。 您選擇知識來源;然後,模型會從此租用戶資料中學習,以確保客服人員的回應以組織的資訊為基礎。 由於 Copilot 與 Microsoft Graph 集成,因此代理還可以推理實時企業數據,為您提供一個強大的工具來查詢和總結來自 Microsoft 365 的最新信息。

您的組織可以在下列案例中使用 Copilot 微調:

  • 問&答 - 建立網域特製代理程式,以跨 .docx、.pdf 和 .html 等格式,瞭解租用戶特定內容,例如法規、稅務代碼或科學報告,並推理其內容。 問&答代理經過調整以反映組織的語氣、術語和合規性語言,提供條款感知答案、摘要和跨文件比較, (例如跨地區) 的監管差異。 這些代理針對深度領域驅動工作流程中穩定、文字較多的內容進行了最佳化,其中精確度和上下文很重要。

  • 文件產生 - 在文件範本和過去的報告上訓練模型,以產生複雜文件的初稿,否則需要多個提示和模型輸出。 例如,您可以建立提案撰寫者代理,以公司核准的格式和語氣彙編銷售提案或起草法律合約。

  • 摘要 - 產生複雜文件的高質量結構化摘要,以反映您組織的語氣、格式和內容優先級。 摘要代理非常適合法律、監管或執行報告等大容量或高風險用例,可確保一致性、減少手動工作並適應您偏好的摘要風格。 使用範例配對訓練您的 LLM,以產生清晰、可操作且符合內部標準的摘要。

微調 LLM

若要成功產生擷取組織專業知識的任務特定代理程式,您需要微調 LLM。

套用下列最佳實務來調整 LLM:

  • 從明確的目標開始 - 確定高價值任務,以確保客服人員提供切實的成果,並將時間、資料和精力集中在推動有意義回報的工作上。 Copilot 微調目前支援三種主要任務類型:專家問答&、文件產生和文件摘要。

  • 策劃優質訓練資料 - 收集任務最相關和最新的文件。 微調的有效性取決於良好的數據。 使用權威來源,例如政策文件、專有報告、核准範本和最終交付項目,以反映您組織的標準、格式和決策邏輯。

    對於文件產生或摘要等任務,提供高品質的輸入/輸出對,以幫助模型學習結構、語氣和內容期望。

  • 定義明確的指示和限制 - 在 Copilot Studio 中設定模型時,您可以輸入客服專員語氣和行為的指示。 提供明確的指導方針;例如,“使用專業和友好的語氣”或“僅使用官方 2023 年政策手冊中的信息”。您也可以提供入門提示或範例問題來引導模型的回應。 這些指示可協助客服專員瞭解上下文和風格。

  • 使用預覽和評估工具 - Copilot 微調包含評估步驟。 訓練模型之後,請使用範例查詢或工作來測試它。 Copilot Studio 可讓您將測試結果與基準答案進行比較。 檢查輸出以確保它們符合您對準確性和語氣的期望。 如果他們沒有,請精簡您的訓練資料或指示並重新訓練。

  • 使用反饋迭代 - 將微調視為迭代過程。 監控代理程式在使用中的執行方式。 定期使用新數據或更正更新模型以保持其準確性。 例如,如果政策發生變化,或者您注意到進一步完善的機會,請納入這些更新並執行另一輪微調。

  • 知道何時使用 Copilot 與微調 - 如果您的案例很廣泛或資訊每天都會變更,則使用 Copilot 的擷取增強生成 (RAG) (在查詢時搜尋您的內容) 可能就足夠了。 微調最適合定義明確的重複性任務,其中模型需要深入了解靜態內容或特定風格。 如果您的任務依賴於一般參考或輕量級綜合,請從 Copilot 開始。 如果輸出需要反映您組織的特定聲音、結構或推理 - 特別是對於可重複的高價值任務 - 這是投資微調的信號。

使用在 LLM 上調校的代理程式

微調模型後,使用者可以使用 Copilot Studio 代理程式產生器,根據該模型建立和部署代理程式。

使用者根據微調的模型與代理程式互動,就像他們與 Copilot 互動一樣 - 透過 Microsoft 365 Copilot 應用程式或 Teams 中的 Copilot Chat 或其他應用程式。 他們可以提出自然語言問題,代理會根據其微調的知識做出回應。

以微調模型為基礎的代理程式可為您的組織提供下列優點:

  • 提高生產力 - 客服專員在日常工作中充當智能助手。 用戶可以獲得即時答案或根據其組織的數據生成內容。 用戶還可以通過依賴代理生成摘要、分析數據、起草通信等來更快地完成任務。

  • 一致性和準確性 - 基於微調模型的代理程式回應與組織資料一致。 這降低了由於過時的文件或外部搜索引擎而出錯的風險。

  • 解決方案建立 - Copilot 微調使用戶能夠創建 AI 驅動的解決方案,以解決其特定的生產力需求。 這在組織中培養了創新文化。

  • 改進的協作 - 客服專員提供了一種讓所有使用者都能使用組織專業知識的方法。 這有助於消除組織中的知識孤島並增加資訊共享和協作。

根據微調模型建立代理程式時,請套用下列最佳實務:

  • 了解模型的範圍 - 代理程式是基於哪些資料和任務? 截至 2022 年,它是否接受過人力資源文件培訓? 它只是為了總結某些報告嗎? 了解範圍可以幫助您提出正確的問題,而不是期望它執行不相關的任務。

  • 提供明確的提示 - 與客服人員互動時,提出清晰、具體的問題。 儘管模型經過微調,但措辭良好的查詢會產生更好的結果。 例如,與其問“告訴我福利”,不如問“全職員工的產假政策是什麼?微調的代理可以處理複雜的查詢,但清晰度有助於提供更精確的資訊。

  • 包含入門提示 - 入門提示顯示在客服專員 UI 中,並協助使用者了解客服專員的功能。 根據微調客服專員的關鍵場景定制您的入門提示,以幫助用戶充分利用客服專員的知識。

  • 精煉和迭代 - 基於微調模型的代理支持多輪對話。 如果客服人員的回應不完全符合您的需求,請完善您的提示或提出後續問題。 微調的客服專員使用後續問題來調整其回應。

  • 套用安全性最佳實務 - 不要要求微調的客服人員提供應保密的資訊,並根據組織的政策處理客服人員回應。

  • 提供回饋以進一步調整代理程式 - 使用回饋機制來訓練或調整微調的代理程式,以提高其效能。 定期提供回饋有助於客服專員不斷改進。 在 Copilot 中,使用者可以選擇豎起大拇指和豎起大拇指圖示來提交有關客服專員回應的回饋。 此意見反應會傳送至 Microsoft,並協助產品小組識別常見問題,並隨著時間改善模型效能。

管理員設定和治理

Copilot 微調提供全租用戶設定、安全性和治理功能,使系統管理員能夠設定具有適當護欄的環境。

下列主要系統管理功能可用於 Copilot 微調:

  • 存取控制 - AI 系統管理員可以為其組織或特定使用者子集啟用 Copilot 微調。 例如,系統管理員可能只為 R&D 和法律部門啟用Copilot 微調,並指定這些小組中的特定使用者來建立微調的模型和特製化代理程式。 訓練和部署模型後,AI 管理員會控制對訓練模型的存取。

  • Microsoft 365 系統管理中心治理 - 系統管理員可以透過 Microsoft 365 系統管理中心中的 Copilot 管理區段來監視微調專案和代理程式。 他們可以檢視已部署的自訂模型,並在模型過時時將其刪除。

  • 安全性與合規性 - Copilot 微調是以企業級安全性建置。 模型定型發生在租用戶隔離的環境中,產生的模型會繼承基礎資料的存取權限。 在培訓期間,不會將客戶資料傳輸到外部服務;微調發生在與您的租用戶關聯的安全雲端內。

    Copilot 微調會排除套用至模型的安全性群組或群組沒有存取權限的任何檔案。 它還建議安全小組添加到其訓練數據中,以最大限度地利用其知識。 此功能為模型提供了額外的安全層。

    注意事項

    當您微調模型時,會根據訓練資料調整模型權重。 對定型資料存取權限的變更不會自動套用至模型;AI 系統管理員必須在 Microsoft 365 系統管理中心更新模型的許可權。

    Copilot 回應中傳回的任何 Microsoft Graph 資料也會接受檔許可權;回應不包含使用者無權存取的資訊。

  • 部署和監控 - 微調和部署模型時,建置者可以在代理程式中使用它,並與組織中有權存取模型的使用者共用代理程式。 系統管理員可以透過安全性群組控制誰可以存取代理程式,並可以透過 Copilot 使用量分析儀錶板監視代理程式使用情況。

免責聲明

AI 管理員負責確保您對本產品的使用符合所有適用的資料保護、隱私和智慧財產權法律。 這包括履行您作為資料控制者根據 GDPR 或 CCPA 等法規承擔的義務。

資料控制者義務

  • 您負責如何在租用戶環境中收集、儲存和使用資料。
  • 您必須確保您的資料實務符合透明度、同意、存取和刪除的法律要求。
  • 您有責任在使用之前驗證此系統產生的任何輸出的準確性、適當性和合規性。 可能需要與主題專家進行審查。
  • 如果您選擇使用自己的資料來訓練自訂模型,則必須確保您擁有訓練集中包含的任何受版權保護材料的適當權利或授權。
  • 版權保護不適用於使用未經授權的受版權保護的內容訓練的模型。 您對任何此類使用承擔全部責任。

資料刪除

  • 如果其資料用於訓練模型的使用者根據 GDPR (或類似法規) 提交有效的刪除要求,則您需要重新訓練模型。
  • 當您微調模型時,會根據訓練資料調整模型權重。 您可以隨時刪除微調的模型。