跳至主要内容

此浏览器不再受支持。

请升级到 Microsoft Edge 以使用最新的功能、安全更新和技术支持。

下载 Microsoft Edge 有关 Internet Explorer 和 Microsoft Edge 的详细信息

使用英语阅读

成就

模块测评

已完成

3 分钟

1.

可以使用哪种评估技术对一组特定提示的响应质量应用自己的判断？

模型基准

手动评估

自动评估

2.

哪个评估程序根据标准指标将生成的响应与基本事实进行比较？

一致性

F1 分数

受保护的材料

3.

哪个评估程序指标使用 AI 模型来判断响应中想法的结构和逻辑流？

一致性

F1 分数

受保护的材料

在检查工作前，必须回答所有问题。

在检查工作前，必须回答所有问题。

反馈

此页面是否有帮助？

否

需要有关本主题的帮助？

想要尝试使用 Ask Learn 阐明或指导你完成本主题？

zh-cn

你的隐私选择

AI 免责声明
早期版本
博客
参与
隐私
使用条款
商标
© Microsoft 2025