你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

使用 Microsoft Foundry 管理并增加资源的配额(Foundry 项目)

注释

本文档引用 Microsoft Foundry (经典) 门户。

🔄 如果你使用的是新门户,请切换到 Microsoft Foundry(新)文档

注释

本文档指的是 Microsoft Foundry(新) 门户网站。

小窍门

另有一篇以中心为重点的配额文章可供参考:管理和增加中心资源的配额

配额使你可以灵活、主动地管理订阅中不同部署之间速率限制的分配。 本文逐步讲解如何管理Microsoft Foundry 模型(Foundry 项目)的配额。

配额使你可以灵活、主动地管理订阅中不同部署之间速率限制的分配。 本文逐步讲解如何管理 Foundry 模型(Foundry 项目)的配额。

Azure 使用限制和配额来防止因欺诈而导致的预算溢出,并履行 Azure 的容量约束。 这也是管理员控制成本的好方法。 对于生产工作负载,请在缩放时考虑这些限制。

在本文中,你将了解:

  • 查看配额和限制
  • 请求增加配额和限制

Foundry 共享配额

Foundry 提供了一个共享配额池,不同区域中的不同用户可以并发使用。 根据可用性,用户可以暂时从共享池访问配额,并使用配额在有限的时间内执行测试。 具体持续时间取决于用例。 如果暂时使用配额池中的配额,则无需为短期提高配额而提交支持票证,也无需等待配额请求获得批准,即可继续处理工作负载。

可以使用共享配额池对模型目录中的 Foundry 模型进行推理测试。 仅使用共享配额创建临时测试终结点,而不是生产终结点。 对于生产中的终结点,应请求专用配额。 共享配额的计费基于使用情况。

在 Foundry 门户中查看和请求配额

使用配额管理同一订阅中多个 Foundry 项目之间的模型配额分配。

  1. 登录到 Microsoft Foundry。 确保 New Foundry 开关处于关闭状态。 这些步骤适用于 Foundry(经典)。

    登录到 Microsoft Foundry。 确保“新建 Foundry”开关处于打开状态。 这些步骤适用于 Foundry(新)。

  2. 从左窗格底部选择 管理中心

    管理中心链接的屏幕截图。

  3. 从左窗格中选择 “配额 ”以打开配额视图,可在其中查看特定 Azure 区域中模型的配额。

    管理中心部分中配额条目的屏幕截图。

  4. 若要从配额视图中请求配额,请展开部署列中列出的任何分组,直到看到模型部署及其相关信息。

    Foundry 门户中一个 Foundry 项目的“模型配额”页的屏幕截图,其中一个分组已展开。

    • 使用“显示所有配额”切换开关来显示所有配额或仅显示当前分配的配额。
    • 使用“分组依据”下拉列表按“配额类型、区域和模型”、“配额类型、模型和区域”或“无”对列表进行分组“无”选项显示模型部署的平面列表,而不是嵌套列表。
    • 在给定模型部署的行项上,选择“配额分配”列中的铅笔图标以编辑模型部署的配额分配。
    • “请求配额”列中选择“请求配额”,以请求标准部署类型的配额增加。
    • 使用页面一侧的图表查看有关配额使用情况的更多详细信息。 图表是交互式的;将鼠标悬停在图表的某一部分上会显示更多信息,选择图表会筛选模型列表。 选择图表图例会筛选图表中显示的数据。
    • 使用 “预配吞吐量 ”链接查看有关预配模型的信息,包括可用于估算工作负荷所需的 PTU 数的 容量计算器
  1. 登录到 Microsoft Foundry。 确保 New Foundry 开关处于关闭状态。 这些步骤适用于 Foundry(经典)。

    登录到 Microsoft Foundry。 确保“新建 Foundry”开关处于打开状态。 这些步骤适用于 Foundry(新)。

  2. 项目有助于组织工作。 正在处理的项目显示在左上角。 如果要创建新项目,请选择项目名称,然后选择 新项目

  3. 从右上角导航中选择“操作”。

  4. 从左窗格中选择“配额”以进入“配额”窗格。 在这里,可以在“ 令牌每分钟 ”选项卡上查看配额,并在 “预配吞吐量单位 ”选项卡上查看预配的模型。

  5. 选择列表中的任一部署,在右侧打开其详细信息窗格。

  6. 在部署详细信息窗格中,转到 使用共享配额的关联部署 部分。 选择表格 操作 列中的铅笔图标,编辑部署的配额分配,并根据需要释放未使用的配额或增加分配。

  7. 选择右上角的 “请求配额 ”按钮,请求增加标准部署类型的配额。