共用方式為


SQL Server 巨量數據叢集中的數據集區簡介

適用於:SQL Server 2019 (15.x)

Important

MICROSOFT SQL Server 2019 巨量數據叢集已淘汰。 SQL Server 2019 巨量數據叢集的支援已於 2025 年 2 月 28 日結束。 如需詳細資訊,請參閱 Microsoft SQL Server 平臺上的公告部落格文章和巨量數據選項。

本文說明 SQL Server 巨量數據叢集中 SQL Server 數據集區 的角色。 下列各節說明數據集區的架構、功能和使用案例。

這段 5 分鐘的影片介紹數據集區,並示範如何從數據集區查詢數據:

數據集區架構

數據集區是由一或多個 SQL Server 數據集區實例所組成,可為叢集提供持續性 SQL Server 記憶體。 它允許針對外部數據源查詢快取數據的效能,以及卸載工作。 數據會使用 T-SQL 查詢或從 Spark 作業擷取到數據集區。 為了增強大型數據集的效能,擷取的數據會分散到分區,並儲存在集區中的所有 SQL Server 實例。 支援的散發方法是迴圈配置資源並復寫。 針對讀取存取優化,會在每個數據集區實例的每個數據表上建立叢集數據行存放區索引。 數據集區可作為 SQL Server 巨量數據叢集的向外延展數據超市。

向外延展數據超市

從 SQL Server 主要實例管理數據集區中 SQL Server 實例的存取權。 系統會建立數據集區的外部數據源,以及要儲存數據快取的PolyBase外部數據表。 在背景中,控制器會在數據集區中建立資料庫,其中包含符合外部數據表的數據表。 從 SQL Server 主要實例,工作流程是透明的;控制器會將特定的外部數據表要求重新導向至數據集區中的SQL Server 實例,該實例可能透過計算集區執行查詢並傳回結果集。 數據集區中的數據只能擷取或查詢,而且無法修改。 因此,任何數據重新整理都需要卸除數據表,然後重新填入數據表,然後重新填入數據表。

數據集區案例

報告用途是常見的數據集區案例。 例如,用於每周報表的聯結多個 PolyBase 資料來源的複雜查詢,可能會轉移至資料池。 快取的數據提供本機快速計算,並不需要返回原始數據集。 同樣地,需要定期重新整理的儀表板資料可以在資料集區中暫存,以優化報告。 機器學習反覆探索也可以受益於在數據集池中快取數據集。

Next steps

若要深入瞭解 SQL Server 巨量數據叢集,請參閱下列資源: