重要
此功能目前以公共预览版提供。
本页介绍如何跨工作区创建和管理无服务器基础环境。
Permissions
- 只有工作区管理员可以创建和管理工作区的基本环境。
- 所有工作区用户都有权访问工作区的基本环境。
- 所有工作区用户可以创建自定义无服务器环境规范。
Azure Databricks 中的基本环境的工作原理
在 Azure Databricks 中,基本环境是一个可共享的 YAML 规范,用于定义 无服务器环境版本 和一组适用于无服务器笔记本的其他 Python 依赖项。 工作区管理员创建和管理基本环境,以便用户可以从一致的缓存环境快速开始,并选择性地添加自己的库。
创建和导出环境规范
创建有效的 YAML 规范的最简单方法是在 “环境 ”端面板中生成环境,然后使用 “导出环境 ”按钮下载 YAML 文件。
- 打开笔记本并连接到无服务器计算。
- 单击“ 环境
笔记本侧面板中的按钮。
- 选择 环境版本。 Databricks 建议使用工作区支持的最新无服务器环境版本。
- 在 “依赖项 ”字段中,添加希望基本环境具有的任何依赖项。 输入每个依赖项后,单击 “添加 依赖项”。 有关添加依赖项的更多说明,请参阅 向笔记本添加依赖项。
- 单击环境面板底部的 “应用 ”,确保规范有效。
- 单击“烤肉”菜单
在环境面板底部,然后单击“ 导出环境”。
- 为 YAML 文件命名并添加到工作区文件夹或 Unity 目录卷。
示例环境规范
以下示例 YAML 基于 MLflow 项目环境规范。 它定义了一个基本环境,其中包含一些库依赖项:
environment_version: '4'
dependencies:
- --index-url https://pypi.org/simple
- -r "/Workspace/Shared/requirements.txt"
- my-library==6.1
- /Workspace/Shared/Path/To/simplejson-3.19.3-py3-none-any.whl
- git+https://github.com/databricks/databricks-cli
将基础环境添加到工作区
若要将环境规范作为基本环境添加到工作区,请执行以下作:
- 在工作区中,转到“设置”。
- 在 “工作区管理员”下,选择“ 计算”。
- 在 用于无服务器计算的基本环境旁边,单击“ 管理”。
- 单击“ 创建新环境”。
- 为基本环境命名。 这是用户在 “基本环境” 下拉菜单中看到的名称。
- 使用文件选取器选择环境规范 YAML 文件。 可以浏览工作区文件或 Unity 目录卷。
- 单击 “创建” 。
基础环境将开始生成。 在基本环境列表中检查 “状态 ”列。 它将在准备就绪时更改为 “准备使用 ”。
注释
与创建和刷新基本环境相关联的使用情况记录已经将billing_origin_product列设置为BASE_ENVIRONMENTS。 此外,特定的基本环境 ID 填充在 usage_metadata.base_environment_id 列中。
设置工作区的默认基础环境
默认情况下,工作区中的无服务器笔记本不使用基本环境。 工作区管理员可以选择默认应用于所有新笔记本的基本环境。
- 在工作区中,转到“设置”。
- 在 “工作区管理员”下,选择“ 计算”。
- 在 用于无服务器计算的基本环境旁边,单击“ 管理”。
- 单击基础环境旁边的星形图标将其设置为默认值。
所有新的无服务器笔记本现在都将默认为所选的基础环境。
更新基础环境
可能需要编辑基本环境文件以更新版本号,或者添加或删除依赖项。
在基本环境列表中,单击要更新的基本环境的 YAML 文件路径。 这会在新选项卡中打开该文件。可以在其中查看或更新文件内容。 更改会自动保存。
更新 YAML 规范后,必须刷新基本环境,以便笔记本和作业选取最新的配置。
- 在要刷新的基本环境旁边,单击烤肉串菜单
然后选择“ 刷新”。
- 单击“确认”。
新会话现在使用更新的基本环境。 必须重启现有笔记本会话才能获取更新。
局限性
- 对于作业,只有笔记本任务可以使用基本环境。
- 不支持无服务器环境版本 1。 使用版本 2 或更高版本。
- 基本环境适用于所有工作区用户。
- 工作区限制为 10 个基本环境。