你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
为 Edge RAG 聊天解决方案配置数据查询和模型设置,以优化聊天结果。 在 Edge RAG 开发人员门户中调整搜索类型、优化模型参数和优化聊天体验。
重要
由 Azure Arc 启用的 Edge RAG 预览版目前为预览版。 有关适用于 Beta 版、预览版或尚未正式发布的 Azure 功能的法律条款,请参阅 适用于 Microsoft azure 预览版的补充使用条款 。
先决条件
开始之前:
- 请确保你处于 基于知识的 聊天模式。
- 查看 Edge RAG 中的搜索类型 ,了解可用的搜索类型以及何时使用它们。
- 若要规划数据引入并选择适当的提示和模型参数,请查看配置 Edge RAG 的聊天解决方案。
- 在 Edge RAG 中添加聊天解决方案的数据源
- 若要访问开发人员门户,必须在 Microsoft Entra 中同时具有“EdgeRAGDeveloper”和“EdgeRAGEndUser”角色。
配置模型设置
若要开始,请配置模型设置。
使用部署和应用注册中提供的域名转到本地门户。 例如,
https://arcrag.contoso.com。使用开发人员凭据(同时分配了“EdgeRAGDeveloper”和“EdgeRAGEndUser”角色)登录。 如果配置了正确的访问权限,则会自动重定向到开发人员门户。
选择 “聊天 ”选项卡以访问 聊天场。
在 “数据推理 ”窗格中,选择 “搜索参数 ”部分。
选择 搜索类型。
可用的搜索类型取决于部署:
搜索类型 Edge RAG 提供的模型 自带模型 (BYOM) 混合文本搜索(默认值) 是的 是的 文本搜索 是的 是的 矢量搜索 是的 是的 混合多模式搜索 否 是的 深度搜索 否 是的 对于除 深度搜索以外的任何搜索类型:
- 在 “模型参数”下的“ 数据推理 ”窗格顶部,根据需要调整 温度 和 Top P 的模型参数。
- 在 “参数”下,根据需要调整 Top-N 文档 和 文本严格性的 模型参数。
- 根据需要查看并更新 系统提示 以适应您的解决方案。
如果选择 “深度搜索”,请根据需要调整查询 扩展 和 子查询数 等参数。
所做的任何更改将在您在聊天中提交新问题时应用。
测试聊天结果
接下来,测试聊天终结点。
在聊天窗口中,输入使用简单问答格式的问题。 需要跨多个文档汇总的查询可能不会返回准确的答案。
请注意,从 Edge RAG 扩展版本
0.1.5和更高版本开始,每个问题仅基于检索的内容进行解答。 答案不包括聊天历史记录的上下文。 问答之间不会保存聊天记录。 将每个问题视为新聊天。(可选)若要查看语言模型在不使用引入数据的情况下如何响应,请将聊天模式切换到 仅模型 并输入问题。 切换回 基于知识的 聊天,以不断优化解决方案与引入的数据。
查看详细信息以优化设置
使用聊天响应详细信息分析和微调模型和搜索参数以优化聊天响应。
在聊天响应下,选择“ 查看详细信息”。
使用聊天详细信息了解推理参数对语言模型对问题响应的影响。
字段 DESCRIPTION LLM 响应 针对相应问题的大型语言模型(LLM)的响应。 用户问题 用户提出的问题。 搜索类型 用于查找问题相关信息的方法,例如混合、文本、矢量或深度搜索。 参数 用于搜索内容和生成 LLM 响应的参数。 系统提示 开发人员设置的自定义说明,以指导语言模型的响应。 此信息可用于除深度搜索之外的所有搜索类型。 重新排序的区块 通过重新评分显示搜索 ID。 此信息可用于除深度搜索之外的所有搜索类型。 LLM 输入区块 作为检索到的内容传递到 LLM 的相关区块;根据文本严格性和图像严格性选择这些区块。 此信息可用于除深度搜索之外的所有搜索类型。 搜索详情 显示搜索详细信息。 文本搜索的结果 查询文本搜索的结果;每个结果显示重新计算分数、搜索距离、文本、文件路径、区块 ID 和上次修改日期。 来自矢量搜索的结果 查询语义搜索的结果;每个结果显示重新计算分数、搜索距离、文本、文件路径、区块 ID 和上次修改日期。 图像搜索的结果 图像搜索查询的结果,每个结果显示重新评分、文件路径、上次修改日期。 若要分析 详细信息,请选择 “复制” ,将文本的 JSON 版本粘贴到文本编辑器中。
调整推理参数以获得引入数据所需的响应类型。
获取 API 终结点
如果对解决方案感到满意,请选择“ 查看终结点 ”以获取在下游应用程序中使用的 API 终结点。