使用 Azure AI 搜索创建知识挖掘解决方案

已完成

从本质上讲,Azure AI 搜索是用于索引和搜索数据的云服务。 但是,它利用 AI 技能 从多种数据格式中提取见解,并能够将其与其他 AI 服务(包括 Azure 视觉和 Azure 文档智能)集成,使其成为构建数字资产管理和知识挖掘解决方案的强大平台。

索引器、索引和技能

Azure AI 搜索解决方案的核心是 索引器,它定义可重复的过程:

  1. 引入数据,例如 Azure 存储容器中的文档或数据库。

  2. 破解 文档以提取其内容 -例如,检索 PDF 文档中的文本和图像数据。

  3. 应用一系列任务以从数据中检索信息,并为索引生成 字段 层次结构。 某些字段是源数据的核心属性(例如文档文件名和上次保存日期),而其他字段则使用 AI 技能生成。 例如:

    • 使用 Azure 视觉 服务为图像生成 标记标题
    • 使用“Azure 语言”服务派生“情绪”或“命名实体”的字段
    • 使用 Azure 文档智能 从表单中提取字段值。
  4. 将提取的字段保留为 索引

    使用 AI 技能从源文档中提取字段并创建索引的索引器示意图。

生成的索引可用于使用户能够基于关键字和筛选条件在提取的字段中搜索信息。

将提取的数据保存到知识存储

除了创建可搜索索引,Azure AI 搜索还可以将提取的数据资产保存到 Azure 存储中的 知识存储 中。

索引器可以在知识存储中保存以下类型的资产:

  • 字段值表。

  • 从文档中提取的图像。

  • 表示数据结构的 JSON 文档;这可以是字段和值的复杂层次结构。

    在知识存储中存储表、图像和文档的索引器示意图。