可観測性を理解する

生成 AI の応答品質を測定する方法は多数あります。一般に、生成 AI を評価および監視するための 3 つのディメンションを考えることができます。これらには次のものが含まれます。

パフォーマンスと品質エバリュエーター: 生成されたコンテンツの精度、根拠、関連性を評価します。
リスクと安全性の評価者: AI によって生成されたコンテンツに関連する潜在的なリスクを評価して、コンテンツのリスクから保護します。これには、AI システムが有害または不適切なコンテンツを生成する傾向の評価が含まれます。
カスタムエバリュエーター: 特定のニーズと目標を満たす業界固有のメトリック。

Microsoft Foundry は、生成型 AI 応答のパフォーマンスと信頼性を向上させる 可観測 機能をサポートしています。 エバリュエーター は、AI 応答の品質、安全性、信頼性を測定する Microsoft Foundry の特殊なツールです。

評価者には、以下のような例があります。

次に、Microsoft Foundry で生成型 AI 機能を試してみましょう。

フィードバック

このページはお役に立ちましたか?