experiments 命令组

Note

此信息适用于 Databricks CLI 版本 0.205 及更高版本。 Databricks CLI 目前处于公共预览阶段。

Databricks CLI 的使用须遵守 Databricks 许可Databricks 隐私声明,包括任何数据使用规定。

experiments CLI 中的命令组允许在 MLflow 中创建、编辑、删除和管理试验。 请参阅使用 MLflow 试验组织训练运行

databricks 实验 create-experiment

创建具有名称的试验。 返回新创建的试验的 ID。 验证同名的另一个试验尚不存在,如果存在同名的另一个试验,则失败。

如果具有给定名称的实验存在,将引发 RESOURCE_ALREADY_EXISTS

databricks experiments create-experiment NAME [flags]

Arguments

NAME

    试验名称。

选项

--artifact-location string

    存储实验相关工件的位置。

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

databricks 试验 创建运行

在实验中创建新运行。 运行通常指的是一次机器学习或数据ETL管道的单次执行。 MLflow 使用运行来记录与单次执行相关的 mlflowParam、mlflowMetric 和 mlflowRunTag。

databricks experiments create-run [flags]

Arguments

None

选项

--experiment-id string

    关联的试验的 ID。

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件

--run-name string

    运行的名称。

--start-time int

    启动运行时的 Unix 时间戳(以毫秒为单位)。

--user-id string

    运行用户的 ID。

全局标志

databricks 实验 delete-experiment

标记试验和关联的元数据、运行、指标、参数和标签以供删除。 如果试验使用 FileStore,也会删除与试验关联的项目。

databricks experiments delete-experiment EXPERIMENT_ID [flags]

Arguments

EXPERIMENT_ID

    关联的试验的 ID。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件

全局标志

databricks 实验删除运行

标记要删除的运行。

databricks experiments delete-run RUN_ID [flags]

Arguments

RUN_ID

    要删除的运行的 ID。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件

全局标志

databricks 实验 删除运行

批量删除实验中在指定时间戳之前或之时创建的运行。 每个请求最多删除 max_runs 个。 若要从 Python 中的 Databricks Notebook 调用此 API,可以在 上使用客户端代码片段

databricks experiments delete-runs EXPERIMENT_ID MAX_TIMESTAMP_MILLIS [flags]

Arguments

EXPERIMENT_ID

    包含要删除的运行的实验的 ID。

MAX_TIMESTAMP_MILLIS

    用于删除运行的最大创建时间戳(自 UNIX 纪元以来的毫秒数)。 仅删除在此时间戳或之前创建的运行。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件

--max-runs int

    一个可选的正整数,指示要删除的最大运行数。

全局标志

databricks 实验 删除标签

在运行过程中删除标签。 标记是可在运行期间和运行完成后更新的运行元数据。

databricks experiments delete-tag RUN_ID KEY [flags]

Arguments

RUN_ID

    标记所记录到的运行的 ID。 Required.

KEY

    标记的名称。 最大大小为 255 字节。 Required.

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件

全局标志

databricks 试验按名称获取

获取具有指定名称的实验的元数据。

此命令将返回已删除的试验,但如果活动试验和已删除的试验共享相同的名称,则首选活动试验。 如果多个已删除的试验具有相同的名称,API 将返回其中一个。

如果不存在具有指定名称的实验,将引发 RESOURCE_DOES_NOT_EXIST

databricks experiments get-by-name EXPERIMENT_NAME [flags]

Arguments

EXPERIMENT_NAME

    关联的试验的名称。

选项

全局标志

databricks 实验 get-experiment

获取具有指定 ID 的实验的元数据。 此命令适用于已删除的试验。

databricks experiments get-experiment EXPERIMENT_ID [flags]

Arguments

EXPERIMENT_ID

    关联的试验的 ID。

选项

全局标志

databricks 实验 get-history

获取给定运行的指定指标的所有值的列表。

databricks experiments get-history METRIC_KEY [flags]

Arguments

METRIC_KEY

    指标的名称。

选项

--max-results int

    每个分页请求要返回的指标记录的最大数量。

--page-token string

    指示要获取的指标历史页的令牌。

--run-id string

    要从中获取指标值的运行的 ID。

--run-uuid string

    已弃用,请改用 --run_id 。 要从中获取指标值的运行的 ID。

全局标志

databricks 实验获取运行

获取某次运行的元数据、指标、参数和标签。 如果为运行记录了具有相同密钥的多个指标,则仅返回具有最新时间戳的值。

如果有多个具有最新时间戳的值,则返回这些值的最大值。

databricks experiments get-run RUN_ID [flags]

Arguments

RUN_ID

    要获取的运行的 ID。 必须提供。

选项

--run-uuid string

    已弃用,请改用 --run_id 。 要获取的运行的 ID。

全局标志

databricks 试验列表项目

列出运行的项目。 采用可选的artifact_path前缀(如果指定),响应仅包含具有指定前缀的项目。 Unity Catalog 卷最多将检索 1000 个项目。 使用 databricks fs ls 列出 Unity Catalog 卷中的项目,该命令支持分页。

databricks experiments list-artifacts [flags]

Arguments

None

选项

--page-token string

    指示要获取的项目结果页的令牌。

--path string

    筛选匹配此路径的项目(根项目目录中的相对路径)。

--run-id string

    要列出其项目的运行的 ID。

--run-uuid string

    已弃用,请改用 --run_id 。 要列出其项目的运行的 ID。

全局标志

databricks 试验列表-试验

获取所有试验的列表。

databricks experiments list-experiments [flags]

Arguments

None

选项

--max-results int

    所需的最大试验数。

--page-token string

    指示要获取的实验页的令牌。

--view-type ViewType

    要返回的实验类型的限定符。 支持的值:ACTIVE_ONLYALLDELETED_ONLY

全局标志

databricks 实验日志批处理

为一次运行记录一批指标、参数和标记。 如果任何数据未能持久保存,服务器将响应错误(非 200 状态代码)。 有关覆盖行为和请求限制,请参阅 实验

databricks experiments log-batch [flags]

Arguments

None

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--run-id string

    要记录到的运行的 ID。

全局标志

databricks 试验日志输入

Note

此命令是实验性的。

将输入(如数据集和模型)记录到一个 MLflow 运行中。

databricks experiments log-inputs RUN_ID [flags]

Arguments

RUN_ID

    要记录到的运行的 ID

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

databricks 试验日志指标

为运行记录指标。 指标是具有关联时间戳的键值对(字符串键、浮点值)。 示例包括表示 ML 模型准确性的各种指标。 可以多次记录指标。

databricks experiments log-metric KEY VALUE TIMESTAMP [flags]

Arguments

KEY

    指标的名称。

VALUE

    要记录的指标的双精度值。

TIMESTAMP

    记录指标时 Unix 时间戳(以毫秒为单位)。

选项

--dataset-digest string

    与指标关联的数据集摘要,例如

--dataset-name string

    与指标关联的数据集的名称。

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--model-id string

    与指标关联的已记录模型的 ID(如果适用)。

--run-id string

    要在其下记录指标的运行的 ID。

--run-uuid string

    已弃用,请改用 --run_id 。 要在其下记录指标的运行的 ID。

--step int

    记录指标的步骤。

全局标志

databricks 试验日志模型

记录模型。

Note

此命令是实验性的。

databricks experiments log-model [flags]

Arguments

None

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--model-json string

    JSON 格式的 MLmodel 文件。

--run-id string

    要记录到的运行的 ID。

全局标志

databricks 试验日志参数

记录用于运行的参数。 参数是键值对(字符串键、字符串值)。 示例包括用于 ML 模型训练的超参数以及 ETL 管道中使用的常量日期和值。 一项运行只能记录一次参数。

databricks experiments log-param KEY VALUE [flags]

Arguments

KEY

    参数的名称。 最大大小为 255 字节。

VALUE

    要记录的参数的字符串值。 最大大小为 500 字节。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--run-id string

    用于记录参数的运行 ID。

--run-uuid string

    [已弃用,请改用 run_id] 记录参数所使用的运行 ID。

全局标志

Databricks 实验 恢复实验

恢复被标记为删除的实验。 这还会还原关联的元数据、运行、指标、参数和标记。 如果试验使用 FileStore,那么与试验相关联的底层工件也会被还原。

如果实验从未创建或已被永久删除,将引发 RESOURCE_DOES_NOT_EXIST

databricks experiments restore-experiment EXPERIMENT_ID [flags]

Arguments

EXPERIMENT_ID

    关联的试验的 ID。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

databricks 实验恢复运行

还原已删除的运行。 这还会还原关联的元数据、运行、指标、参数和标记。

如果运行从未创建或已被永久删除,将引发 RESOURCE_DOES_NOT_EXIST

databricks experiments restore-run RUN_ID [flags]

Arguments

RUN_ID

    要还原的运行的 ID。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

databricks 实验恢复运行

批量还原实验中在指定时间戳之后删除的运行。 每个请求最多还原 max_runs 次。

databricks experiments restore-runs EXPERIMENT_ID MIN_TIMESTAMP_MILLIS [flags]

Arguments

EXPERIMENT_ID

    包含要还原的运行的实验的 ID。

MIN_TIMESTAMP_MILLIS

    自 UNIX 纪元以来用于还原运行的最小删除时间戳(以毫秒为单位)。 仅还原在不早于此时戳删除的运行。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--max-runs int

    一个可选的正整数,用于指示要还原的最大运行次数。

全局标志

databricks 实验搜索功能

搜索满足指定搜索条件的实验。

databricks experiments search-experiments [flags]

Arguments

None

选项

--filter string

    表示 SQL 筛选器条件的字符串

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--max-results int

    所需的最大试验数。

--page-token string

    指示要获取的实验页的令牌。

--view-type ViewType

    要返回的实验类型的限定符。 支持的值:ACTIVE_ONLYALLDELETED_ONLY

全局标志

databricks 试验搜索运行

搜索满足表达式的运行实例。 搜索表达式可以使用 mlflowMetric 和 mlflowParam 键。

databricks experiments search-runs [flags]

Arguments

None

选项

--filter string

    一个基于参数、指标和标签的过滤表达式,该表达式允许返回部分运行实例。

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--max-results int

    所需的最大运行数。

--page-token string

    当前运行页的令牌。

--run-view-type ViewType

    是否仅显示活动运行、仅显示已删除运行或所有运行。 支持的值:ACTIVE_ONLYALLDELETED_ONLY

全局标志

databricks 实验 set-experiment-tag

在实验上设置标记。 试验标记是可以更新的元数据。

databricks experiments set-experiment-tag EXPERIMENT_ID KEY VALUE [flags]

Arguments

EXPERIMENT_ID

    要在其下记录标记的实验的 ID。 必须提供。

KEY

    标记的名称。 支持最大大小为 250 字节的键。

VALUE

    要记录的标签的字符串值。 支持最大大小为 64KB 的值。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

databricks 实验设置标签

在运行上设置标记。 标记是可在运行期间和运行完成后更新的运行元数据。

databricks experiments set-tag KEY VALUE [flags]

Arguments

KEY

    标记的名称。 支持最大大小为 250 字节的键。

VALUE

    要记录的标签的字符串值。 支持最大大小为 64KB 的值。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--run-id string

    要在其下记录标记的运行的 ID。

--run-uuid string

    已弃用,请改用 --run_id 。 要在其下记录标记的运行的 ID。

全局标志

databricks 实验 update-experiment

更新实验。

databricks experiments update-experiment EXPERIMENT_ID [flags]

Arguments

EXPERIMENT_ID

    关联的试验的 ID。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--new-name string

    如果有提供,实验名称将被更改为新的名称。

全局标志

databricks 试验更新-运行

更新运行。

databricks experiments update-run [flags]

Arguments

None

选项

--end-time int

    运行结束时的 Unix 时间戳(以毫秒为单位)。

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--run-id string

    要更新的运行的 ID。

--run-name string

    运行的更新名称。

--run-uuid string

    已弃用,请改用 --run_id 。 要更新的运行的 ID。

--status UpdateRunStatus

    已更新运行状态。 支持的值:FAILEDFINISHEDKILLEDRUNNINGSCHEDULED

全局标志

Databricks 实验 获取权限等级

获取实验权限级别。

databricks experiments get-permission-levels EXPERIMENT_ID [flags]

Arguments

EXPERIMENT_ID

    要获取或管理权限的实验。

选项

全局标志

Databricks 实验权限获取

获取试验的权限。 试验可以从其根对象继承权限。

databricks experiments get-permissions EXPERIMENT_ID [flags]

Arguments

EXPERIMENT_ID

    要获取或管理权限的实验。

选项

全局标志

databricks 实验功能设置权限

设置试验权限。

设置对象的权限,替换现有权限(如果存在)。 如果未指定任何权限,则删除所有直接权限。 对象可以从其根对象继承权限。

databricks experiments set-permissions EXPERIMENT_ID [flags]

Arguments

EXPERIMENT_ID

    要获取或管理权限的实验。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

Databricks 实验更新权限设置

更新试验权限。 试验可以从其根对象继承权限。

databricks experiments update-permissions EXPERIMENT_ID [flags]

Arguments

EXPERIMENT_ID

    要获取或管理权限的实验。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

全局标志

--debug

  是否启用调试日志记录。

-h--help

    显示 Databricks CLI、相关命令组或相关命令的帮助。

--log-file 字符串

    一个字符串,表示要将输出日志写入到的文件。 如果未指定此标志,则默认会将输出日志写入到 stderr。

--log-format 格式

    日志格式类型,textjson。 默认值是 text

--log-level 字符串

    一个表示日志格式级别的字符串。 如果未指定,则禁用日志格式级别。

-o, --output 类型

    命令输出类型为textjson。 默认值是 text

-p, --profile 字符串

     ~/.databrickscfg 文件中用于运行命令的配置文件的名称。 如果未指定此标志,则如果存在,将使用名为 DEFAULT 的配置文件。

--progress-format 格式

    显示进度日志的格式: defaultappendinplacejson

-t, --target 字符串

    如适用,要使用的捆绑包目标