了解大型語言模型 (LLM) 應用程式的開發生命週期
在瞭解如何使用提示流程之前,讓我們先探索大型語言模型 (LLM) 應用程式的開發生命週期。
生命週期包含下列階段:
- 初始化:定義使用案例並設計解決方案。
- 測試:使用小型數據集開發流程並進行測試。
- 評估和精簡:使用較大的數據集評估流程。
- 生產環境:部署和監控應用程式和流程。
在評估和精簡和生產期間,您可能會發現您的解決方案需要改善。 您可以回到實驗階段,您會在這個階段持續開發流程,直到對結果感到滿意為止。
讓我們更詳細地探索每個階段。
初始化
假設您想要設計和開發 LLM 應用程式來分類新聞文章。 開始建立任何專案之前,您需要定義您想要做為輸出的類別。 您必須瞭解一般新聞文章的外觀、如何將文章呈現為應用程式的輸入,以及應用程式如何產生所需的輸出。
換句話說,在 初始化 期間,您會:
- 定義 目標
- 收集 範例數據集
- 建置 基本提示
- 設計 流程
若要設計、開發及測試 LLM 應用程式,您需要做為輸入的範例數據集。 範例資料集是您最終預期剖析為 LLM 應用程式輸入的一部分少量代表性資料。
收集或建立範例數據集時,您應該確保數據的多樣性,以涵蓋各種案例和邊緣案例。 您也應該從數據集移除任何隱私權敏感性資訊,以避免任何弱點。
試驗
您收集了新聞文章的範例數據集,並決定要分類文章的類別。 您設計了將新聞文章當做輸入的流程,並使用 LLM 來分類文章。 若要測試流程是否產生預期的輸出,您可以針對範例數據集執行該輸出。
實驗階段是反覆的程序,您 (1) 會在此期間針對範例資料集執行流程。 接著 (2) 您會評估提示的效能。 如果您對結果感到滿意,您可以 繼續進行 評估和精簡。 如果您認為有改善空間,則可以 (4) 變更提示或流程本身來修改流程。
評估和精簡
當您對根據範例數據集分類新聞文章的流程輸出感到滿意時,您可以針對較大的數據集評估流程的效能。
藉由在較大的數據集上測試流程,您可以評估 LLM 應用程式將如何一般化為新的數據。 在評估期間,您可以識別優化或精簡化的潛在瓶頸或區域。
當您編輯流程時,您應該先對較小的數據集執行它,再針對較大的數據集執行它。 使用較小的數據集測試流程可讓您更快速地回應任何問題。
一旦 LLM 應用程式在處理各種案例時看起來穩固且可靠,您就可以決定將 LLM 應用程式移至生產環境。
生產
最後,您的新聞文章分類應用程式已準備好上線。
在生產期間,您可以:
- 優化 將進來文章分類的流程,以提升效率與成效。
- 將流程部署至端點。 當您呼叫端點時,會觸發流程以執行,並產生所需的輸出。
- 藉由收集使用量數據和使用者意見反應來監視解決方案的效能。 藉由瞭解應用程式的執行方式,您可以視需要改善流程。
探索完整的開發生命週期
現在您已瞭解 LLM 應用程式開發生命週期的每個階段,您可以探索完整的概觀: