Udostępnij przez


Notatnik samouczka oceny agenta Mosaic AI (MLflow 2)

Ważne

Usługa Databricks zaleca używanie platformy MLflow 3 do oceniania i monitorowania aplikacji GenAI. Na tej stronie opisano ocenę agenta MLflow 2.

W poniższym notatniku pokazano, jak ocenić aplikację generatywnej sztucznej inteligencji przy użyciu zastrzeżonych sędziów LLM Agent Evaluation, niestandardowych metryk i etykiet od ekspertów z dziedziny. Demonstruje on następujące kwestie:

  • Jak załadować dzienniki produkcyjne (ślady) do zestawu danych oceny.
  • Jak przeprowadzić ocenę i analizę pierwotnej przyczyny.
  • Jak utworzyć metryki niestandardowe w celu automatycznego wykrywania problemów z jakością.
  • Jak wysyłać dzienniki produkcyjne dla MŚP, aby oznaczyć i rozwijać zestaw danych oceny.

Aby przygotować agenta do przedprodukcji, zobacz notes demonstracyjny agenta Mozaiki AI. Aby uzyskać ogólne informacje, zapoznaj się z Mosaic AI Agent Evaluation (MLflow 2).

Notes dotyczące metryk niestandardowych, wytycznych i etykiet ekspertów w dziedzinie oceny agentów

Pobierz laptopa