开发 Databricks 应用

若要使用 Databricks 应用生成数据和 AI 应用,可以使用支持 Python 的任何 IDE,例如 PyCharm、IntelliJ IDEA 或 Visual Studio Code。 Azure Databricks 建议使用用于 Visual Studio Code 的 Databricks 扩展,但也可以在 Databricks 笔记本和文件编辑器中编辑代码。

Databricks 应用环境会自动设置多个环境变量,例如运行应用和身份验证所需的值的 Azure Databricks 工作区的 URL。 许多应用程序还需要自定义配置,例如用于运行应用程序的特定命令或访问 SQL 仓库的参数。 使用 app.yaml 文件定义这些设置。

在本地开发应用:

  • 在首选 IDE 中生成和测试应用。
  • 在本地命令行上运行应用,并在浏览器中预览它。
  • 应用完成并测试后,将代码和所需文件移动到 Azure Databricks 工作区。

使用以下主题来支持应用开发:

Topic 说明
定义应用运行时 指定应用如何运行,包括命令、参数和默认设置。
配置计算大小 选择应用的 CPU 和内存,以满足工作负荷要求。
定义环境变量 为身份验证、工作区访问或特定于应用的设置配置环境变量。
管理依赖项 列出应用执行所需的 Python 包到 requirements.txtpackage.json 文件中。
添加资源 包括应用在运行时依赖的静态文件或其他资产。