このブラウザーはサポートされなくなりました。
Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。
一連の特定のプロンプトに応答の品質に関する独自の判断を適用するには、どの評価手法を使用できますか?
モデルベンチマーク
手動評価
自動評価
標準メトリックに基づいて、生成された応答と地上の真理値を比較するエバリュエーターはどれですか?
一貫性
F1 スコア
保護材料
AI モデルを使用して、応答内のアイデアの構造と論理フローを判断するエバリュエーター メトリックはどれですか?
保護された材料
作業を確認する前にすべての問題に回答する必要があります。
このページはお役に立ちましたか?
このトピックについてサポートが必要ですか?
このトピックの意図を把握したり、理解を深めたりするために Ask Learn を使ってみませんか?