介绍

1 分钟

检索扩充生成（RAG）应用程序结合了信息检索和生成 AI，通过使用大型数据集和高级搜索技术提供准确的上下文感知答案。

假设你是一名中型企业的解决方案架构师，负责为员工构建内部知识助理来查询公司策略。当前系统在响应时间缓慢的情况下苦苦挣扎，通常检索不相关的或过时的信息，令人沮丧的用户。你的团队决定使用 Azure Database for PostgreSQL 和 Azure OpenAI 实现检索扩充生成（RAG）应用程序。但是，随着数据集增长到数百万行，诸如确保快速检索、保持准确性和避免 AI 生成的响应可能不正确等挑战。此外，涉及多个概念的复杂查询，例如“欧洲 HR 的度假政策是什么？需要精确的筛选和排名。若要解决这些问题，需要优化检索速度，通过高级索引和分块策略提高准确性，并探索轻量级知识图等创新解决方案。本模块将指导你完成构建和优化可缩放的 RAG 管道，这些管道专为此类现实世界的挑战而定制。

完成本模块后，可以执行以下操作：

解释 RAG 模式及其对大型语言模型接地的好处。
通过在 PostgreSQL 中实现诸如 IVFFlat（倒排文件+平面压缩）、 HNSW（分层导航小型世界）、DiskANN（磁盘近似最近邻）等矢量索引来优化大规模数据集的相似性搜索。
生成完整的 RAG 管道，该管道检索相关的数据区块，并使用 Azure Database for PostgreSQL 和 Azure OpenAI 生成基于上下文的答案。
应用高级检索技术，包括混合搜索、语义排名、区块优化和 GraphRAG 以提高精度和召回率。

反馈

此页面是否有帮助？