共用方式為


馬賽克 AI 代理程式評估教學課程筆記本 (MLflow 2)

這很重要

Databricks 建議使用 MLflow 3 來評估和監視生成式 AI 應用程式。 本頁說明 MLflow 2 代理程式評估。

下列筆記文件示範如何使用 Agent Evaluation 的專屬 LLM 模型、自訂化指標和來自領域專家的標籤來評估生成型人工智慧應用程式。 其示範如下:

  • 如何將生產記錄(追蹤)載入評估數據集。
  • 如何執行評估並執行根本原因分析。
  • 如何建立自定義計量來自動偵測質量問題。
  • 如何傳送中小企業的生產記錄來標記和演進評估數據集。

若要讓您的代理程式準備好進行生產前,請參閱 馬賽克 AI 代理程式示範筆記本。 如需一般資訊,請參閱 馬賽克 AI 代理程式評估 (MLflow 2)

代理評估自訂指標、指導方針和領域專家標籤筆記本

拿筆記本