你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

规划和管理 Microsoft Foundry 的成本

注释

本文档适用于 Microsoft Foundry(经典)门户。

🔄 如果你使用的是新门户,请切换到 Microsoft Foundry(新)文档

注释

本文档适用于 Microsoft Foundry(新)门户。

从规划开始,有效地管理 Microsoft Foundry 成本。 本文介绍如何在部署前估算费用、实时跟踪支出,以及设置警报以避免预算意外。

你将了解的内容:

  • 使用 Azure 定价计算器估算成本
  • 监视不同模型类型的实际支出
  • 创建预算和警报来控制支出
  • 了解 Azure 托管模型与合作伙伴模型之间的计费差异

本文介绍如何规划和管理 Microsoft Foundry 的成本。 首先,使用 Azure 定价计算器来帮助规划 Foundry 成本,然后再添加资源。 接下来,在添加 Azure 资源时,查看预估成本。 开始使用 Azure 资源后,请使用成本管理功能来设置预算并监视成本。

本文介绍如何规划和管理 Microsoft Foundry 的成本。 首先,使用 Azure 定价计算器来帮助规划 Foundry 成本,然后再添加资源。 接下来,在添加 Azure 资源时,查看预估成本。 开始使用 Azure 资源后,请使用成本管理功能来设置预算并监视成本。

小窍门

Foundry 在 Azure 定价计算器中没有特定页面。 Foundry 由其他几个 Azure 服务组成,其中一些服务是可选的。 本文介绍如何使用定价计算器来估算这些服务的成本。

在 Foundry 门户中使用 Foundry 工具。 Foundry 工具的成本只是 Azure 帐单中每月成本的一部分。 系统会针对 Azure 订阅中使用的所有服务和资源(包括第三方服务)计费。 还可以查看预测的成本,并确定支出趋势,以查找你可能想要采取行动的领域。

先决条件

若要查看和分析成本,需要:

需要授予访问权限? 了解如何 分配对成本管理数据的访问权限

使用 Foundry 工具之前估算成本

在添加 Foundry Tools 之前,请使用 Azure 定价计算器 估算成本。

  1. 在 Azure 定价计算器中搜索并选择产品,例如 Foundry Tools 中的 Azure 语言。

  2. 选择多个产品来估算多个产品的成本。 例如,搜索并选择 Azure AI Search 以添加潜在成本。

向项目添加新资源时,请返回到此计算器,并在此处添加相同资源来更新成本估算。

与 Foundry 关联的成本

创建 Foundry 资源时,需付费使用 Azure OpenAI、语音、内容安全、视觉、文档智能和语言等服务。 成本因每项服务及其中的某些功能而异。 在 Foundry Tools 定价页上查找更多详细信息。

了解 Foundry 工具的计费模型

Foundry Tools 运行在 Azure 基础架构上,该基础架构在您部署新资源时会产生费用。 请务必了解额外的基础结构可能会产生成本。 对已部署的资源进行更改时需要管理该成本。

创建或使用 Foundry Tools 资源时,会根据所使用的服务付费。 Foundry 工具提供了两种计费模型:

  • 无服务器 API:使用无服务器 API 定价时,会根据所使用的 Foundry 工具产品/服务根据其计费信息计费。

  • 承诺层:通过承诺层定价,你承诺使用多个服务功能支付固定费用,因此,可以根据工作负荷的需求获得可预测的总成本。 根据所选计划向你计费。 有关可用服务、如何注册以及购买计划时的注意事项的信息,请参阅 快速入门:购买承诺层定价

注释

如果您使用的资源超出承诺计划提供的配额,您需要根据您在 Azure 门户中购买承诺计划时列出的超额用量支付额外费用。

了解 Foundry 模型的计费模型

基于令牌的定价

语言模型通过将输入分解为令牌来理解和处理输入。 作为参考,对于典型的英文文本,每个标记大约是四个字符。 处理图像或音频的模型也会将它们分解为令牌,以便进行计费。 每个图像或音频内容的令牌数取决于模型和输入分辨率。

每个令牌的成本因所选模型系列而异,但在所有情况下,在 Foundry 中部署的模型按 1,000 个令牌收费。 例如,Azure OpenAI 聊天完成模型推理 按 1,000 个令牌按不同的费率收费 ,具体取决于模型和部署类型。 对于大多数模型,定价现在以 100 万个令牌列出。

令牌成本是针对输入和输出计算的。 例如,假设你有一个 1,000 个标记的 JavaScript 代码示例,要求模型转换为 Python。 您为发送的初始输入请求支付大约 1,000 个令牌,为接收到的响应输出再支付 1,000 个令牌,总共支付 2,000 个令牌。

实际上,对于这种类型的完成调用,令牌的输入和输出并不是完全对等的。 从一种编程语言转换为另一种编程语言可能会导致较长或更短的输出,具体取决于许多因素。 其中一个因素是分配给 max_tokens 参数的值。

由 Azure 直接销售的模型

由 Azure 直接销售的模型(包括 Azure OpenAI)将直接收费。 它们显示为每个 Foundry 资源下的计费指示器。 Microsoft直接处理此计费。 检查账单时,您会看到用于计算每个已用模型输入和输出的计费计量器。

来自合作伙伴和社区的模型

第三方提供商(如 Cohere)提供的模型使用 Azure 市场计费。 与 Microsoft 计费表不同,这些条目与已部署 Foundry 资源所在的资源组相关联,而不是与 Foundry 资源本身关联。 由于模型供应商直接向你收费,你将在类别 市场服务名称SaaS 下看到一些条目,这些条目用于记录每个已使用模型的输入和输出。

重要

Azure 直接销售的模型(包括 Azure OpenAI)与来自合作伙伴和社区的模型之间的这种区别只会影响模型可供你使用的方式以及计费方式。 在所有情况下,模型都托管在 Azure 云中,并且与外部服务或提供商没有交互。

微调的模型

Azure OpenAI 微调模型的收费是根据 训练文件中令牌的数量计算的。 有关最新价格,请参阅 官方定价页

部署微调模型后,你还需要根据以下情况付费:

  • 托管小时数。
  • 每千个令牌的推理(根据输入使用情况和输出使用情况划分)。

托管时长成本是需要注意的重要因素,因为在微调模型部署后,即使你并未主动使用它,它仍会持续产生每小时的费用。 密切监视已部署微调模型的成本。

重要

部署自定义模型后,如果部署随时保持非活动状态超过 15 天,则会删除部署。 如果模型是在超过 15 天前部署的且在连续 15 天内无补全或聊天补全调用,则自定义模型的部署处于“非活动”状态

删除非活动状态的部署时,不会删除或影响基础自定义模型,并且可以随时重新部署自定义模型。

部署的每个自定义(微调)模型都会产生每小时的托管成本,无论是否对模型进行补全或聊天补全调用都是如此。

HTTP 错误响应代码和计费状态

如果服务执行处理,即使状态代码不成功(不是 200),也可能需要支付费用。 例如,由于内容筛选器或输入限制而导致的 400 错误,或者由于超时而出现 408 错误。

如果服务不进行处理,则不需要支付费用。 例如,由于身份验证而导致的 401 错误或因超出速率限制而出现 429 错误。

监控成本

使用 Foundry 时,会产生费用。 Azure 资源使用单位成本因时间间隔(秒、分钟、小时和天)或单位使用情况(字节、MB 等)而异。 可以在成本分析中查看产生的成本。

使用成本分析时,可以在图表和表中查看不同时间间隔的成本。 有些示例是按天、当前、上个月和年划分的。 还可以对比预算和预测的成本来查看成本。 切换到随时间推移的较长视图有助于确定支出趋势,以便查看可能出现超支的位置。 如果已创建预算,还可以轻松查看超支的地方。

可以从 Microsoft Foundry 门户或 Azure 门户访问成本信息。

可以从 Microsoft Foundry 门户或 Azure 门户访问成本信息。

重要

Foundry 成本只是整个应用程序或解决方案成本的子集。 需要监视应用程序或解决方案中使用的所有 Azure 资源的成本。

配置权限以查看成本

需要在订阅级别的资源组中具有 AI 用户角色成本管理读取角色才能查看成本。

也可以创建以下自定义规则:

  • Microsoft.Consumption/*/read
  • Microsoft.CostManagement/*/read
  • Microsoft.Resources/subscriptions/read
  • Microsoft.CognitiveServices/accounts/AIServices/usage/read

注释

需要订阅或资源组范围内的 “所有者” 角色才能在该范围内创建自定义角色。

若要创建自定义角色,请参阅以下文章之一:

有关自定义角色的详细信息,请参阅 Azure 自定义角色

若要创建自定义角色,请构造一个角色定义 JSON 文件,该文件指定角色的权限和范围。 以下示例定义在特定资源级别范围内的自定义 Foundry 成本读取者角色:

{
    "Name": "Foundry Cost Reader",
    "IsCustom": true,
    "Description": "Can see cost metrics in Foundry",
    "Actions": [
        "Microsoft.Consumption/*/read",
        "Microsoft.CostManagement/*/read",
        "Microsoft.Resources/subscriptions/read",
        "Microsoft.CognitiveServices/accounts/AIServices/usage/read"
    ],
    "NotActions": [],
    "DataActions": [],
    "NotDataActions": [],
    "AssignableScopes": [
        "/subscriptions/<subscriptionId>/resourceGroups/<resourceGroupName>/providers/Microsoft.CognitiveServices/accounts/<foundryResourceName>"
    ]
}

替换<subscriptionId><resourceGroupName><foundryResourceName>为实际值。

在 Foundry 门户中监控

  1. 登录到 Microsoft Foundry。 确保“新建 Foundry”开关处于关闭状态。 这些步骤涉及到 Foundry(经典)
    登录到 Microsoft Foundry。 确保 New Foundry 开关处于打开状态。 这些步骤适用于 Foundry(新)
  2. 使用以下部分来监视成本。

注释

这些是估计值,不反映任何可能显示在最终帐单上的折扣或特殊合同定价。 它们还仅涵盖标准部署成本,而不是 预配的吞吐量产品/服务

代理成本

  1. 在右上角导航中选择操作
  2. 在左窗格中选择 “概述 ”。
  3. 在页面顶部,选择订阅、一个或多个项目和日期范围。
  4. “估计成本”图块显示所选日期所选项目的所有代理的估计值。 这些估计目前不包括即时代理和非 Foundry 代理的成本。

“资产”下的“代理”选项卡的屏幕截图,其中显示了“估计成本”列,其中每个代理的每月成本估算基于配置和使用情况。

对于单个代理预估:

  1. 在左窗格中选择 “资产
  2. 选择“ 代理 ”选项卡。
  3. “估计成本”列显示基于代理配置和使用情况模式的每月估算值。

“代理”选项卡的屏幕截图,其中显示了“名称”、“状态”和“估计成本”列的代理列表。“估计成本”列显示每月值。

有关单个代理的更多详细信息:

  1. 在右上角导航中选择“ 生成 ”。
  2. 在左窗格中选择 “代理 ”。
  3. 选择代理。
  4. 选择代理的“ 监视 ”选项卡。
  5. 设置右上角的日期范围。
  6. 运营指标显示的给定范围内的令牌费用和使用情况。

“生成”页的屏幕截图,其中显示了“模型”窗格,其中突出显示了所选模型。

模型部署成本

  1. 在右上角导航中选择“ 生成 ”。
  2. 在左窗格中选择 “模型 ”。
  3. 选择模型。
  4. 选择“ 监视 ”选项卡。
  5. 选择右上角的日期范围。 可以看到总成本以及给定范围的估计成本图表。

Azure 门户的屏幕截图,其中显示了所选模型和日期范围的“监视”选项卡,其中包含总成本和估计成本图表。

选择“ 查看更多详细信息 ”或 “Azure 成本管理 ”链接时,会定向到“ 成本管理 ”部分下的 Azure 门户。 显示的成本反映了整个认知服务帐户的聚合费用。 这些不同于此处显示的成本,这些成本仅适用于所选模型。 这些成本仅以美元提供,而不能以用户的计费货币提供。

注释

令牌和请求图表有时可能会显示比估计成本视图更低的值,因为延迟到达的使用事件可能未包含在这些图表中。 如果存在不匹配,请依赖估计成本作为最准确的参考,并请注意Azure 成本管理发票仍然是最终事实来源。

在 Azure 门户中监控

下面是有关如何在 Azure 门户中监视成本的示例。 成本仅用作示例。 成本因使用的服务和使用量而异。

  1. 登录到 Azure 门户

  2. 可以查看资源组或单个 Foundry 资源的成本。

    小窍门

    若要打开资源组,请执行以下步骤:

    1. 登录到 Microsoft Foundry。 确保“新建 Foundry”开关处于关闭状态。 这些步骤涉及到 Foundry(经典)
      登录到 Microsoft Foundry。 确保 New Foundry 开关处于打开状态。 这些步骤适用于 Foundry(新)
    2. 选择项目,然后从左侧菜单中选择 管理中心
    3. “资源 ”标题下,选择“ 概述”。
    4. “资源属性”下,选择链接以直接在 Azure 门户中打开它。

    小窍门

    若要在 Azure 门户中打开 Foundry 资源,请执行以下作:

    1. 登录到 Microsoft Foundry。 确保“新建 Foundry”开关处于关闭状态。 这些步骤涉及到 Foundry(经典)
      登录到 Microsoft Foundry。 确保 New Foundry 开关处于打开状态。 这些步骤适用于 Foundry(新)
    2. 从右上角导航中选择“操作”。
    3. 选择 “管理员”。
    4. 选择第二列中父资源的链接。
    5. 在 Azure 门户中,选择在右上角“查看资源”标题下的“管理此资源”。
  3. 在 Azure 门户中,对于资源组或 Foundry 资源,请在成本管理下选择成本分析

  4. 你将看到成本概述。 还可以添加筛选器,例如部署级别标记和用户定义的标记。 例如,若要查看基于模型部署的成本:

    包含部署级别标记的成本概述的屏幕截图。

  5. 选择“按资源>列出的成本以打开“成本分析”页。

  6. 可以看到 Foundry 资源的成本,以及该资源下多个模型部署的成本拆分。

    屏幕截图显示了 Foundry 资源成本在各模型部署间的分布。

按计量器分析成本明细

若要了解成本明细,请使用 Azure 门户中 的成本分析工具 。 按照以下步骤了解推理成本:

  1. 登录到 Azure 门户 ,然后选择包含要监视的项目的资源组。

    小窍门

    若要打开资源组,请执行以下步骤:

    1. 登录到 Microsoft Foundry。 确保“新建 Foundry”开关处于关闭状态。 这些步骤涉及到 Foundry(经典)
      登录到 Microsoft Foundry。 确保 New Foundry 开关处于打开状态。 这些步骤适用于 Foundry(新)
    2. 选择项目,然后从左侧菜单中选择 管理中心
    3. “资源 ”标题下,选择“ 概述”。
    4. “资源属性”下,选择链接以直接在 Azure 门户中打开它。

    小窍门

    若要在 Azure 门户中打开 Foundry 资源,请执行以下作:

    1. 登录到 Microsoft Foundry。 确保“新建 Foundry”开关处于关闭状态。 这些步骤涉及到 Foundry(经典)
      登录到 Microsoft Foundry。 确保 New Foundry 开关处于打开状态。 这些步骤适用于 Foundry(新)
    2. 从右上角导航中选择“操作”。
    3. 选择 “管理员”。
    4. 选择第二列中父资源的链接。
    5. 在 Azure 门户中,选择在右上角“查看资源”标题下的“管理此资源”。
  2. 在 Azure 门户中,在“成本管理”下选择“成本分析”。

  3. 默认情况下,成本分析的范围限定为所选资源组。

    重要

    成本分析 范围限定为部署 Foundry 资源的资源组。 与合作伙伴和社区提供的模型关联的费用计量器显示在资源组下,而非显示在 Foundry 资源下。

  4. 将“分组依据”修改为“计量”。 现在可以看到,对于此特定资源组,成本的来源来自不同的模型系列。

    有关如何按资源组中的每个计量查看成本的屏幕截图。

由 Azure 直接销售的模型

由 Azure 直接销售的模型(包括 Azure OpenAI)将直接收费。 它们显示为每个 Foundry 资源下的计费指示器。 Microsoft直接处理此计费。 检查账单时,您会看到用于计算每个已用模型输入和输出的计费计量器。

成本分析仪表板的屏幕截图,其范围限定为部署 Foundry 资源的资源组,其中突出显示了 Azure OpenAI 和 Phi 模型的计量。成本按计量分组。

来自合作伙伴和社区的模型

第三方提供商提供的模型(如 Cohere)使用 Azure 市场计费。 与微软计费仪表不同,这些条目与您的 Foundry 部署所在的资源组相关联,而不是与 Foundry 资源本身相关联。 由于模型供应商直接向你收费,你将在类别 市场服务名称SaaS 下看到一些条目,这些条目用于记录每个已使用模型的输入和输出。

成本分析仪表板的屏幕截图,其范围限定为部署 Foundry 资源的资源组,其中突出显示了通过 Azure 市场计费的模型的计量。成本按计量器分组。

重要

Azure 直接销售的模型(包括 Azure OpenAI)与来自合作伙伴和社区的模型之间的这种区别只会影响模型可供你使用的方式以及计费方式。 在所有情况下,模型都托管在 Azure 云中,并且与外部服务或提供商没有交互。

按资源监视成本

可以通过按资源对成本进行分组来获取更详细的计费信息:

  1. 成本分析中,选择“按资源>成本”。

    有关如何按资源组中的每个资源查看成本的屏幕截图。

  2. 现在,可以看到生成每个计费计量的资源。 若要了解构成该成本的明细,可以将“分组依据”修改为“计量”,将图表类型切换为“折线图”

  3. Azure OpenAI 模型和 Microsoft 模型以仪表的形式显示在每个 Foundry Tool 资源下方。

  4. 某些提供商的模型显示为全局资源下的计量。 "Global" 一词与模型部署的 SKU 无关(例如,“Global standard”)。 如果有多个 Foundry 工具资源,则帐单为每个 Foundry 工具资源的每个模型都包含一个条目。 资源计量的格式为 [model-name]-[GUID] ,其中 [GUID] 是与给定 Foundry Tools 资源关联的唯一标识符。 你注意到计费表记录了你使用的每个模型的输入和输出。

    成本分析仪表板的屏幕截图,其范围限定为部署 Foundry Tools资源的资源组,其中突出显示了通过 Azure 市场计费的模型的计量。成本按资源分组。

评估与 Foundry 工具相关的成本时,请务必了解范围。 如果资源是同一资源组的一部分,则可以在该级别确定成本分析的范围,以了解对成本的影响。 如果资源分布在多个资源组中,则可以将范围限定为订阅级别。

在更高层次的范围内,常常需要添加更多筛选器,以便更好地关注 Azure OpenAI 的使用情况。 当范围限定在订阅级别时,你会看到在 Azure OpenAI 成本管理上下文中可能不在意的许多其他资源。 当范围限定在订阅级别时,请导航到“成本管理”服务下的完整“成本分析工具”

下面是如何使用 成本分析工具 查看订阅或资源组累计成本的示例:

  1. 在 Azure 搜索栏中搜索 成本管理 以导航到完整的服务体验,其中包括更多选项,例如创建预算。
  2. 如有必要,如果“范围:”未指向要分析的资源组或订阅,请选择“更改”
  3. 在左侧,选择 “报告 + 分析>成本分析”。
  4. 在“ 所有视图 ”选项卡上,选择 “累计成本”。

显示如何访问累计成本的成本分析仪表板的屏幕截图。

成本分析仪表板显示根据为“范围”指定的内容分析的累计成本。

成本分析仪表板的屏幕截图,其中的范围设置为订阅。

如果尝试按服务添加筛选器,则无法在列表中找到 Azure OpenAI。 出现这种情况是因为 Azure OpenAI 具有一部分 Foundry 工具的通用性,其中服务级别筛选器是 认知服务。 如果想要在订阅中查看所有 Azure OpenAI 资源,而无需任何其他类型的 Foundry 工具资源,请改为限定为 服务层级:Azure OpenAI

突出显示了服务层级的成本分析仪表板的屏幕截图。

在 Azure 市场中监控模型的成本

Azure 市场提供无服务器 API 部署。 模型发布者可能会根据产品/服务应用不同的成本。 Foundry 门户中的每个项目都有自己的套餐订阅,可用于监视该项目上发生的成本和消耗。 使用 Microsoft 成本管理来监视成本:

  1. 登录到 Azure 门户

  2. 选择门户菜单图标以打开左窗格。

    门户菜单图标的屏幕截图。

  3. 在左窗格中,选择 “成本管理 + 计费 ”,然后选择“ 成本管理”。

  4. 在左窗格中,在 “报表 + 分析”部分下,选择 “成本分析”。

  5. 选择一个视图,例如“资源”。 随即会显示与每个资源关联的成本。

    显示如何展示每个资源成本的“成本分析工具”屏幕截图。

  6. 在“类型”列中,选择筛选器图标以筛选 microsoft.saas/resources类型的所有资源。 此类型对应于从 Azure 市场中可用的产品/服务创建的资源。 为方便起见,可以按包含字符串“SaaS”的资源类型进行筛选

    如何按包含字符串 SaaS 的资源类型进行筛选的屏幕截图。

  7. 每个项目的每个模型产品/服务都会显示一个资源。 这些资源的命名为 [模型套餐名称]-[GUID]。

  8. 选择展开资源详细信息,以访问与资源关联的每个成本计量。

    • “层级”表示产品/服务。
    • “产品”是产品/服务中的具体产品。

    某些模型提供商可能对两者使用相同的名称。

    显示与不同模型产品/服务及其关联计量对应的不同资源的屏幕截图。

    小窍门

    请记住,每个项目根据其订阅的每个计划创建一个资源。

  9. 展开详细信息时,按照与产品/服务关联的每个计量报告成本。 每个计量可能跟踪不同的成本来源,例如推理或微调。 将显示以下计量值(当它们与某些成本相关时):

    计量 分组 说明
    paygo-inference-input-tokens 基本模型 与作为基础模型推理输入的代币相关的成本。
    paygo-inference-output-tokens 基本模型 与作为基本模型推理输出生成的代币相关的成本。
    paygo-微调模型推理托管 微调模型 与托管微调模型的推理终结点关联的成本。 此值不是托管模型的成本,而是让终结点为其提供服务的成本。
    paygo-finetuned-model-inference-input-tokens 微调模型 与用作微调模型推理输入的令牌关联的成本。
    paygo-finetuned-model-inference-output-tokens 微调模型 与作为微调模型的推理输出而生成的令牌关联的成本。

创建预算

使用自动警报防止成本溢出。创建用于 跟踪支出限制并 设置警报 的预算,以在成本接近或超出阈值时通知你。

最佳做法: 为 Azure 订阅和资源组创建预算和警报,作为总体成本监视策略的一部分。

如果需要在监视中更精细,请使用 Azure 中特定资源或服务的筛选器创建预算。 筛选器有助于确保不会意外地创建花费更多资金的新资源。 有关创建预算时筛选选项的详细信息,请参阅 “组”和“筛选”选项

重要

虽然 OpenAI 有一个硬性限制选项,可阻止超出预算,但 Azure OpenAI 目前不提供此功能。 你可以从操作组开始自动化,作为预算通知的一部分,以采取更高级的操作,但此功能需要额外的定制开发。

导出成本数据

可以将 成本数据导出 到存储帐户。 当你或其他人员需要执行额外的数据分析以降低成本时,导出数据会很有帮助。 例如,财务团队可以使用 Excel 或 Power BI 分析数据。 可以按每天、每周或每月计划导出成本,并设置自定义的日期范围。 建议导出成本数据来检索成本数据集。

可能累算的其他成本

启用将数据发送到 Azure Monitor 日志和警报等功能会为这些服务带来额外的成本。 这些成本在其他服务和订阅级别中是可见的,但在仅查看 Foundry 资源时则不可见。

使用 Azure 预付款

可以使用 Azure 预付款(之前称为货币承诺)额度支付由 Azure 直接销售的模型费用。 但是,无法使用 Azure 预付款额度支付其他提供商模型的费用,因为它们是通过 Azure 市场计费的。

有关详细信息,请参阅 Azure 定价计算器