你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文讨论 Azure、计算机和存储、网络及 Edge RAG 的其他要求。
重要
由 Azure Arc 启用的 Edge RAG 预览版目前为预览版。 有关适用于 Beta 版、预览版或尚未正式发布的 Azure 功能的法律条款,请参阅 适用于 Microsoft azure 预览版的补充使用条款 。
资源要求
若要开始使用 Edge RAG,需要以下 Azure 和本地资源。
Azure 资源
在部署 Edge RAG 之前,请确保已准备好以下 Azure 资源和权限:
| 资源 | 说明 |
|---|---|
| Azure 订阅 | 一个 Azure 订阅。 |
| Microsoft Entra ID 权限 | - 创建 Microsoft Enterprise Entra 应用程序的权限。 - 能够向应用程序添加新的或现有的 Microsoft Entra 用户和组。 作为先决条件任务的一部分,请为 Azure Arc 启用的 Edge RAG 预览版配置身份验证。 |
| 由 Azure Arc 启用的 AKS 的权限 | 部署 AKS Arc Kubernetes 群集、创建节点池和安装扩展的权限。 作为先决条件任务的一部分,请参阅验证 Azure Arc 启用的 Edge RAG 预览版的参与者角色。 |
| 传输层安全性 (TLS) 终止证书 | 由公司特定的证书颁发机构 (CA) 或已知公共 CA 签名的证书,用于安全部署。 如果未提供,Edge RAG 将生成自签名证书。 不建议对生产环境使用自签名证书。 |
本地资源
在环境中有以下本地资源时,支持 Edge RAG 部署:
| 资源 | 说明 |
|---|---|
| Azure 本地基础结构* | Azure 本地基础结构的实例,最低版本 2504。 |
| Azure 本地上的 AKS Arc 群集* | 在 Azure Local 实例上运行的 AKS Arc 群集。 使用 GPU 提高性能;在映像和文本方案中,节点池中至少包含 四个启用了 GPU 的 VM 。 作为先决条件任务的一部分,请在 Azure Loca 上为 Azure Arc 启用的 Edge RAG 预览版准备 AKS 群集。 |
| 可路由的静态 IP 地址 |
MetalLB 负载均衡器的一个可路由静态 IP 地址。 如果已使用可路由 IP 配置 MetalLB,可以跳过此要求。 必须可从客户端计算机访问该 IP。 作为先决条件任务的一部分,以下文章介绍了如何设置 MetalLB: - 为由 Azure Arc 启用的 Edge RAG 预览版安装网络和可观测性组件 - 为 Azure Arc 启用的 Edge RAG 预览版配置 DNS。 |
| 网络文件系统 (NFS) | 包含本地文档或映像的 NFS v3.0 或 v4.1。 仅支持AUTH_SYS身份验证方法。 不支持 Kerberos 身份验证。 需要共享路径、NFS 用户 ID 和组 ID。 请参阅 Windows Server 和 Linux 的设置指南。 |
| Windows 计算机(可选) | 通过配置驱动程序计算机或本地管理主机,轻松管理 Azure Local 上已启用 Azure Arc 的 Kubernetes 群集。 作为先决条件任务的一部分,安装 Azure CLI、kubectl 和 Helm 等工具来准备驱动程序计算机。 有关详细信息,请参阅: - 在 Azure Arc 启用的 Azure Local for Edge RAG 预览版上准备 AKS 群集 - 配置计算机以管理已启用 Azure Arc 的 Kubernetes 群集。 |
* 在 Azure 本地环境上验证 Edge RAG。
最低 VM 硬件要求
下表列出了虚拟机的最低硬件要求。
| 模式 | VM 规格和建议的最小大小 |
|---|---|
| GPU | 4 个启用了 GPU 的 VM 建议大小(基于 GPU 选择一个): - Standard_NC8_A2 - Standard_NC8_A16 4 个 CPU VM - 最低规格:8 个 vCPU,32 GB - 建议的大小:Standard_D8s_v3 |
有关详细信息,请参阅 Windows Server 上 AKS 的资源限制、VM 大小和区域。
下表列出了适用于 Edge RAG 的每个语言模型的硬件建议。
| 模型名称 | GPU 支持 | 最小 VM SKU |
|---|---|---|
| Microsoft/Phi-3.5-mini-instruct | Nvidia A2 Nvidia A16 |
Standard_NC8_A2 Standard_NC8_A16 |
| mistralai/Mistral-7B-Instruct-v0.2 | Nvidia A2 Nvidia A16 |
Standard_NC8_A2 Standard_NC8_A16 |
如果计划使用仅限 CPU 的设置,请查看文件大小和区块限制。 请参阅:
最低软件要求
下表列出了 Edge RAG 支持的最小软件要求。
| 组件 | 最低要求 |
|---|---|
| VM 操作系统 | Linux |
| Azure 本地版本* | Azure 本地 2504 版本 |
| Azure CLI | 随 Azure Local 一起提供。 请勿更新到最新版本的 Azure CLI,并使用最初随 Azure Local 一起提供的版本。 |
* 在 Azure 本地环境上验证 Edge RAG。
网络要求
目前所有的 Azure Local 和 Azure Local 上的 AKS 的要求
支持的文档格式和大小
Edge RAG 支持以下功能和相关文件格式:
| 能力 | 支持的文件格式 |
|---|---|
| 文本提取 | PDF、DOCX、TXT、MHTML、MHT、MD |
| 图像引入 | JPG、JPEG、PNG |
通过 GPU 设置,每个文件最多可达到 30 MB。 如果使用仅限 CPU 的设置,则每个文件最多达到 5 MB。
目前不支持未列出的文档或图像文件类型,如音频和视频文件。
支持的数据源
Edge RAG 支持将 AUTH_SYS 身份验证作为数据源的网络文件系统 (NFS) v3.0 和 v4.1。 不支持 Kerberos 身份验证。
支持的区域
如果计划将快速入门用于评估或开发目的,请在已启用 Azure Arc 的 Kubernetes 所支持的任意区域中部署适用于 Edge RAG 的 Azure 资源。 对于生产部署,请在 Azure 本地支持的任何区域中部署 Edge RAG 和所需资源。
要获取按服务列出的最新受支持区域列表,请参阅 Azure 产品于各个区域的支持情况表。