共用方式為


SQL Server 巨量數據叢集的機器學習指南

適用於:SQL Server 2019 (15.x)

本文說明如何使用適用於機器學習案例的 SQL Server 巨量數據叢集。

Important

MICROSOFT SQL Server 2019 巨量數據叢集已淘汰。 SQL Server 2019 巨量數據叢集的支援已於 2025 年 2 月 28 日結束。 如需詳細資訊,請參閱 Microsoft SQL Server 平臺上的公告部落格文章和巨量數據選項。

SQL Server 巨量數據叢集中的機器學習簡介

SQL Server 巨量數據叢集可使用不同的技術堆疊來啟用機器學習案例和解決方案: SQL Server 機器學習服務和Apache Spark ML

SQL Server 大數據叢集使用已確立的 SQL Server 機器學習服務技術堆疊,在 SQL Server 引擎內提供機器學習功能,啟用高效能的資料庫內機器學習推論與預測情境。

針對以巨量數據為基礎的機器學習案例,HDFS 用於巨量數據裝載和 Apache Spark ML 功能,更具成本效益、可調整且功能強大。

機器學習案例

機器學習功能可啟用不同的應用程式和解決方案,例如:詐騙偵測、預測、變換,以及一般分類和回歸工作。 不過,請務必針對案例使用最佳技術。

Aspect SQL Server 機器學習服務 Apache Spark ML
Data placement 利用 SQL Server 上表格資料的區域性。 進階數據層。 使用 HDFS 擴充巨量數據層;非結構化、半結構化和結構化數據。
Best for 低延遲推斷和評分案例 1. 巨量數據之上的分散式批次定型和評分機器學習模型
2. ML 的 ETL 資料流終點以及大規模數據準備和特徵化
Feeds 機器學習支援的 BI 儀錶板、報表和應用程式。 需要低延遲 批次評分數據可能會傳送至 SQL Server,以推動機器學習驅動的情境
Latency 需要低延遲 可接受的延遲較高
Read more 在 SQL Server 巨量數據叢集上使用機器學習服務執行 Python 和 R 腳本 SQL Server 巨量數據叢集上的 Spark 機器學習簡介

Next steps

如需詳細資訊,請參閱 SQL Server 巨量數據叢集簡介