标识 Azure Databricks 工作负载
Azure Databricks 为各种工作负载提供功能,其中包括机器学习和大型语言模型 (LLM)、数据科学、数据工程、BI 和数据仓库以及流式处理。
数据工程
Azure Databricks 为需要协作处理复杂数据处理任务的数据科学家和工程师提供功能。 它为数据湖屋中的大数据处理提供了与 Apache Spark 集成的环境,支持 Python、R、Scala、SQL 等多种语言。 该平台促进数据浏览、可视化和数据管道的开发。
机器学习
Azure Databricks 支持大规模生成、训练和部署机器学习模型。 它包括 MLflow,这是一个用于管理 ML 生命周期(包括试验、可重现性和部署)的开源平台。 它还支持各种 ML 框架,例如 TensorFlow、PyTorch 和 Scikit-learn,使其能够灵活地适用于不同的 ML 任务。
SQL
主要通过 SQL 与数据交互的数据分析师可以在 Azure Databricks 中使用 SQL 仓库。 Azure Databricks 工作区 UI 提供熟悉的 SQL 编辑器、仪表板和自动可视化工具,用于直接在 Azure Databricks 中分析和可视化数据。 此工作负载非常适合运行快速即席查询和从大型数据集创建报表。
注释
SQL 仓库包含在高级层(或更高)层中。 标准工作区不提供 SQL 仓库。