適用於:SQL Server 2019 (15.x)
Important
MICROSOFT SQL Server 2019 巨量數據叢集已淘汰。 SQL Server 2019 巨量數據叢集的支援已於 2025 年 2 月 28 日結束。 如需詳細資訊,請參閱 Microsoft SQL Server 平臺上的公告部落格文章和巨量數據選項。
本文說明 SQL Server 巨量數據叢集中 SQL Server 主要實例 的角色。 主要集區包含 SQL Server 的主要實例。 主要實例是在 SQL Server 巨量數據叢集中執行的 SQL Server 實例。 主要實例會管理連線能力、向外延展查詢、元數據和用戶資料庫,以及機器學習服務。
SQL Server 主要實例提供下列功能:
Connectivity
SQL Server 主要實例會提供叢集的外部可存取 TDS 端點。 您可以將 Azure Data Studio 或 SQL Server Management Studio 之類的應用程式或 SQL Server 工具連線到此端點,就像任何其他 SQL Server 實例一樣。
向外延展查詢管理
SQL Server 主要實例包含向外延展查詢引擎,可用來將查詢分散到 計算集區節點上的 SQL Server 實例。 擴展式查詢引擎透過 Transact-SQL 提供對叢集中所有 Hive 資料表的存取功能,無需進行任何額外設定。
元數據和用戶資料庫
除了標準 SQL Server 系統資料庫之外,SQL 主要實例也包含:
- 保存 HDFS 數據表元數據的元數據資料庫。
- 數據平面分片對應圖。
- 提供叢集數據平面存取權的外部數據表詳細數據。
- PolyBase 外部數據源和外部數據表定義於使用者資料庫中。
您也可以選擇將自己的使用者資料庫新增至 SQL Server 主要實例。
機器學習服務
SQL Server 機器學習服務功能是資料庫引擎的附加元件功能。 用於在 SQL Server 中執行 Java、R 和 Python 程式代碼的機器學習服務功能。 這項功能是以 SQL Server 擴充性架構為基礎,它會隔離外部進程與核心引擎進程,但完全整合關係型數據做為預存程式、包含 R 或 Python 語句的 T-SQL 腳本,或 Java、R 或包含 T-SQL 的 Python 程式代碼。
作為 SQL Server 巨量數據叢集的一部分,根據預設,SQL Server 主要實例上將會提供機器學習服務。 在 SQL Server 主要實例上啟用外部腳本執行之後,就可以使用 sp_execute_external_script 來執行 Java、R 和 Python 腳本。
巨量數據叢集中機器學習服務的優點
SQL Server 巨量數據叢集可讓您輕鬆地將巨量數據聯結至通常儲存在企業資料庫中的維度數據。 當巨量數據不只是在組織部分的手中,而且包含在報表、儀錶板和應用程式中時,巨量數據的價值會大幅增加。 同時,數據科學家可以繼續使用 Spark/HDFS 生態系統工具,並輕鬆地即時存取 SQL Server 主要實例中的數據,以及在 可透過 SQL Server 主要實例存取的外部數據源中。
使用 SQL Server 巨量數據叢集,您可以使用企業數據湖執行更多作業。 SQL Server 開發人員和分析師可以:
- 建置取用企業數據湖數據的應用程式。
- 使用 Transact-SQL 查詢對所有數據進行推理。
- 使用 SQL Server 工具和應用程式的現有生態系統來存取和分析企業數據。
- 減少透過數據虛擬化和數據集市的資料移動需求。
- 繼續針對巨量數據案例使用Spark。
- 使用 Spark 或 SQL Server 建置智慧型企業應用程式,以在資料湖上訓練模型。
- 在生產資料庫中運作模型以獲得最佳效能。
- 將數據直接串流至企業數據超市以進行即時分析。
- 使用互動式分析和 BI 工具以可視化方式探索數據。
Next steps
若要深入瞭解 SQL Server 巨量數據叢集,請參閱下列資源: