Freigeben über


Bewertungstestfälle für Agents einstufen

Aktiviert für Öffentliche Vorschau Allgemeine Verfügbarkeit
Administrierende, Erstellende, Marketingfachkräfte oder Mitarbeitende in der Analyse, automatisch 21. September 2025 -

Geschäftswert

Das Grader-Framework verbessert die Bewertung der Agents durch die Einführung flexibler Bewertungsmethoden, die über ein einfaches Bestehen/Nichtbestehen hinausgehen. Entscheidungsträger können aus genauen Übereinstimmungen, Schlüsselwortprüfungen, Ähnlichkeitsalgorithmen, Absichtserkennung und KI-gesteuerten Qualitätsmetriken wählen, wodurch eine genauere und aussagekräftigere Validierung von Agentantworten ermöglicht wird. Diese Flexibilität ermöglicht Es Teams, Fehler zu erkennen, Schwellenwerte zu optimieren und zu verstehen, warum Antworten fehlschlagen, Vertrauen verbessern und Iteration beschleunigen.

Einzelheiten zur Funktion

Die Graders-Funktion in Copilot Studio erweitert das Evaluierungsframework, indem flexible und konfigurierbare Methoden zum Bewerten von Agentantworten ermöglicht werden. Anstatt sich nur auf binäre Pass/Fail zu verlassen, können Die Entscheidungsträger jetzt den am besten geeigneten Bewertungsansatz pro Testfall auswählen, um Genauigkeit, Transparenz und Anpassungsfähigkeit in verschiedenen Szenarien sicherzustellen.

Sie haben die Wahl zwischen drei Testmethoden, die auch als Bewertungsmethoden bezeichnet werden, um Agentenantworten auszuwerten: Qualität, Ähnlichkeit und Textabgleich. Weitere Informationen zu den verschiedenen Testmethoden finden Sie unter Testmethoden.

Geografische Gebiete

Besuchen Sie den Bericht "Funktionsstandort erkunden" für Microsoft Azure-Regionen, wo dieses Feature geplant oder verfügbar ist.

Verfügbare Sprachen

Besuchen Sie den Bericht "Explore Feature Language", um Informationen über die Verfügbarkeit dieser Funktion zu erhalten.

Erstellen von Testfällen zum Auswerten Ihres Agents (Dokumente)