你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure Arc 启用的 Edge RAG 预览版所需的内容

本文讨论 Azure、计算机和存储、网络及 Edge RAG 的其他要求。

重要

由 Azure Arc 启用的 Edge RAG 预览版目前为预览版。 有关适用于 Beta 版、预览版或尚未正式发布的 Azure 功能的法律条款,请参阅 适用于 Microsoft azure 预览版的补充使用条款

资源要求

若要开始使用 Edge RAG,需要以下 Azure 和本地资源。

Azure 资源

在部署 Edge RAG 之前,请确保已准备好以下 Azure 资源和权限:

资源 说明
Azure 订阅 一个 Azure 订阅
Microsoft Entra ID 权限 - 创建 Microsoft Enterprise Entra 应用程序的权限。
- 能够向应用程序添加新的或现有的 Microsoft Entra 用户和组

作为先决条件任务的一部分,请为 Azure Arc 启用的 Edge RAG 预览版配置身份验证
由 Azure Arc 启用的 AKS 的权限 部署 AKS Arc Kubernetes 群集、创建节点池和安装扩展的权限。 作为先决条件任务的一部分,请参阅验证 Azure Arc 启用的 Edge RAG 预览版的参与者角色
传输层安全性 (TLS) 终止证书 由公司特定的证书颁发机构 (CA) 或已知公共 CA 签名的证书,用于安全部署。 如果未提供,Edge RAG 将生成自签名证书。 不建议对生产环境使用自签名证书。

本地资源

在环境中有以下本地资源时,支持 Edge RAG 部署:

资源 说明
Azure 本地基础结构* Azure 本地基础结构的实例,最低版本 2504。
Azure 本地上的 AKS Arc 群集* 在 Azure Local 实例上运行的 AKS Arc 群集。 使用 GPU 提高性能;在映像和文本方案中,节点池中至少包含 四个启用了 GPU 的 VM 。 作为先决条件任务的一部分,请在 Azure Loca 上为 Azure Arc 启用的 Edge RAG 预览版准备 AKS 群集
可路由的静态 IP 地址 MetalLB 负载均衡器的一个可路由静态 IP 地址。 如果已使用可路由 IP 配置 MetalLB,可以跳过此要求。 必须可从客户端计算机访问该 IP。

作为先决条件任务的一部分,以下文章介绍了如何设置 MetalLB:

- 为由 Azure Arc 启用的 Edge RAG 预览版安装网络和可观测性组件
- 为 Azure Arc 启用的 Edge RAG 预览版配置 DNS
网络文件系统 (NFS) 包含本地文档或映像的 NFS v3.0 或 v4.1。 仅支持AUTH_SYS身份验证方法。 不支持 Kerberos 身份验证。 需要共享路径、NFS 用户 ID 和组 ID。 请参阅 Windows ServerLinux 的设置指南。
Windows 计算机(可选) 通过配置驱动程序计算机或本地管理主机,轻松管理 Azure Local 上已启用 Azure Arc 的 Kubernetes 群集。

作为先决条件任务的一部分,安装 Azure CLI、kubectl 和 Helm 等工具来准备驱动程序计算机。 有关详细信息,请参阅:

- 在 Azure Arc 启用的 Azure Local for Edge RAG 预览版上准备 AKS 群集
- 配置计算机以管理已启用 Azure Arc 的 Kubernetes 群集

* 在 Azure 本地环境上验证 Edge RAG。

最低 VM 硬件要求

下表列出了虚拟机的最低硬件要求。

模式 VM 规格和建议的最小大小
GPU 4 个启用了 GPU 的 VM
建议大小(基于 GPU 选择一个):
- Standard_NC8_A2
- Standard_NC8_A16
4 个 CPU VM
- 最低规格:8 个 vCPU,32 GB
- 建议的大小:Standard_D8s_v3

有关详细信息,请参阅 Windows Server 上 AKS 的资源限制、VM 大小和区域

下表列出了适用于 Edge RAG 的每个语言模型的硬件建议。

模型名称 GPU 支持 最小 VM SKU
Microsoft/Phi-3.5-mini-instruct Nvidia A2
Nvidia A16
Standard_NC8_A2
Standard_NC8_A16
mistralai/Mistral-7B-Instruct-v0.2 Nvidia A2
Nvidia A16
Standard_NC8_A2
Standard_NC8_A16

如果计划使用仅限 CPU 的设置,请查看文件大小和区块限制。 请参阅:

最低软件要求

下表列出了 Edge RAG 支持的最小软件要求。

组件 最低要求
VM 操作系统 Linux
Azure 本地版本* Azure 本地 2504 版本
Azure CLI 随 Azure Local 一起提供。 请勿更新到最新版本的 Azure CLI,并使用最初随 Azure Local 一起提供的版本。

* 在 Azure 本地环境上验证 Edge RAG。

网络要求

目前所有的 Azure LocalAzure Local 上的 AKS 的要求

支持的文档格式和大小

Edge RAG 支持以下功能和相关文件格式:

能力 支持的文件格式
文本提取 PDF、DOCX、TXT、MHTML、MHT、MD
图像引入 JPG、JPEG、PNG

通过 GPU 设置,每个文件最多可达到 30 MB。 如果使用仅限 CPU 的设置,则每个文件最多达到 5 MB。

目前不支持未列出的文档或图像文件类型,如音频和视频文件。

支持的数据源

Edge RAG 支持将 AUTH_SYS 身份验证作为数据源的网络文件系统 (NFS) v3.0 和 v4.1。 不支持 Kerberos 身份验证。

支持的区域

如果计划将快速入门用于评估或开发目的,请在已启用 Azure Arc 的 Kubernetes 所支持的任意区域中部署适用于 Edge RAG 的 Azure 资源。 对于生产部署,请在 Azure 本地支持的任何区域中部署 Edge RAG 和所需资源。

要获取按服务列出的最新受支持区域列表,请参阅 Azure 产品于各个区域的支持情况表