Dieser Browser wird nicht mehr unterstützt.
Führen Sie ein Upgrade auf Microsoft Edge durch, um die neuesten Features, Sicherheitsupdates und den technischen Support zu nutzen.
Welches Bewertungsverfahren können Sie verwenden, um Ihr eigenes Urteil über die Qualität der Antworten auf eine Reihe von spezifischen Eingabeaufforderungen anzuwenden?
Modell-Benchmarks
Manuelle Auswertungen
Automatisierte Auswertungen
Welcher Evaluator vergleicht generierte Antworten mit der Grundwahrheit anhand von Standardmetriken?
Kohärenz
F1-Bewertung
Geschütztes Material
Welche Auswertungsmetrik verwendet ein KI-Modell, um die Struktur und den logischen Ideenfluss in einer Antwort zu beurteilen?
Sie müssen alle Fragen beantworten, bevor Sie Ihre Arbeit überprüfen können.
War diese Seite hilfreich?
Benötigen Sie Hilfe zu diesem Thema?
Möchten Sie versuchen, Ask Learn zu verwenden, um Sie durch dieses Thema zu klären oder zu leiten?