部署跟踪的应用

MLflow 追踪通过捕获执行详细信息来帮助监控生产中的 GenAI 应用程序。可以通过两种方式部署跟踪的应用程序：

比较部署选项

下表比较了可用于每个部署位置的跟踪日志记录选项：

部署位置	MLflow 实验跟踪日志记录	生产监视	推理表
在 Databricks 上部署	已支持	已支持	已支持
在 Databricks 外部部署	已支持	已支持	不支持

上面的部署选项表列出了用于跟踪日志记录的多个选项。下表比较了以下跟踪日志记录选项：

跟踪日志记录选项	访问和管理	延迟*	吞吐量*	大小限制*
MLflow 实验跟踪日志记录	可以在 MLflow 试验 UI 中查看跟踪，也可以以编程方式查询跟踪。访问由 MLflow 实验 ACLs 管理。	实时	每秒最多 60 个查询（QPS）	支持非常大的跟踪。每个试验的最大跟踪数为 100K。
生产监视	记录到 Delta 表的跟踪由 Unity 目录权限进行管理。	约 15 分钟延迟	每秒最多 50 个查询（QPS）	支持非常大的跟踪。每个试验的最大跟踪数为 100K。
已启用 AI 网关的推理表	记录到 Delta 表的跟踪使用 Unity Catalog 权限进行管理。	30-90 分钟延迟	QPS 限制与提供终结点限制的模型匹配	跟踪大小限制。对每个试验的跟踪没有限制。

* 请参阅资源限制以了解其他平台的限制，以及通过与 Databricks 帐户团队合作可以提高的限制的信息。

†在进行 MLflow 试验日志记录时，跟踪信息作为工件存储，你可以为其指定自定义存储位置。例如，如果您创建一个工作区实验并将artifact_location设置为 Unity Catalog 卷，那么数据访问的跟踪将受到Unity Catalog 卷权限的管理。

选择部署方法：

此页面是否有帮助？