這很重要
Azure Synapse Analytics 數據總管 (預覽版) 將於 2025 年 10 月 7 日淘汰。 在此日期之後,將會刪除在 Synapse 數據總管上執行的工作負載,且相關聯的應用程式數據將會遺失。 強烈建議移轉至 Microsoft Fabric 中的 Eventhouse 。
Microsoft雲端移轉處理站 (CMF) 計劃的設計目的是協助客戶移轉至 Fabric。 此計劃提供客戶實作鍵盤培訓資源,不收取任何費用。 這些資源會指派 6-8 周,並具有預先定義且已同意的範圍。 客戶提名會由 Microsoft 帳戶小組接受,或直接透過向 CMF 小組提交 協助申請 來接受。
單鍵擷取可讓數據擷取程式變得簡單、快速且直覺。 一鍵導入可協助您快速開始導入資料、建立資料庫資料表、映射結構。 從不同來源選取不同數據格式的數據,作為一次性或連續的匯入過程。
下列功能讓單鍵擷取變得如此實用:
- 由導入向導引導的直覺式體驗
- 在幾分鐘內匯入數據
- 內嵌來自不同來源的數據:本機檔案、Blob 和容器(最多 10,000 個 Blob)
- 匯入各種格式的數據
- 將數據內嵌至新的或現有的數據表
- 系統會為您建議資料表映射和結構,且易於變更。
第一次擷取數據或數據架構不熟悉時,單鍵擷取特別有用。
先決條件
Azure 訂用帳戶。 建立免費的 Azure 帳戶。
使用 Synapse Studio 或 Azure 入口網站建立資料總管集區
建立Data Explorer資料庫。
在 Synapse Studio 的左側窗格上,選取 [資料]。
選取 + (新增資源) >[資料總管集區],並使用下列資訊:
Setting 建議的值 Description 集區名稱 contosodataexplorer 要使用的 Data Explorer 集區的名稱 名稱 TestDatabase 資料庫名稱在叢集內必須是唯一而不重複。 預設保留期限 365 保證資料持續可供查詢的時間範圍 (天)。 時間範圍是從資料被導入的時間開始測量的。 預設快取期間 31 在 SSD 儲存裝置或 RAM 中 (而非長期儲存裝置),讓受到頻繁查詢的資料維持可用狀態的時間範圍 (天)。 選取 [建立] 以建立資料庫。 建立時間通常不到一分鐘。
建立數據表
- 在 Synapse Studio 的左側窗格上,選取 [開發]。
- 在 KQL 指令碼下方,選取+ (新增資源) >[KQL 指令碼]。 您可以在右側窗格上命名指令碼。
- 在 連線至 選單中,選取 contosodataexplorer。
- 在 [使用資料庫] 功能表中,選取 [TestDatabase]。
- 貼上下列命令,並選取 [執行] 以建立資料表。
.create table StormEvents (StartTime: datetime, EndTime: datetime, EpisodeId: int, EventId: int, State: string, EventType: string, InjuriesDirect: int, InjuriesIndirect: int, DeathsDirect: int, DeathsIndirect: int, DamageProperty: int, DamageCrops: int, Source: string, BeginLocation: string, EndLocation: string, BeginLat: real, BeginLon: real, EndLat: real, EndLon: real, EpisodeNarrative: string, EventNarrative: string, StormSummary: dynamic)小提示
確認資料表已成功建立。 在左側窗格上,選取 資料,然後在 contosodataexplorer 的更多選單中選取 重新整理。 在 contosodataexplorer 下方,展開 [資料表],確認 StormEvents 資料表出現在清單中。
存取單鍵精靈
單鍵擷取向導會逐步引導您完成簡便的單鍵擷取流程。
若要從 Azure Synapse 存取精靈:
在 Synapse Studio 的左側窗格上,選取 [資料]。
在 [數據總管資料庫] 底下,以滑鼠右鍵按兩下相關的資料庫,然後選取 [在 Azure 數據總管中開啟]。
以滑鼠右鍵按兩下相關的集區,然後選取 [內嵌新數據]。
若要從 Azure 入口網站存取精靈:
在 Azure 入口網站中,搜尋並選取相關的 Synapse 工作區。
在 [數據總管集區] 底下,選取相關的集區。
在 歡迎來到資料探索者池 主畫面上,選取 引入新資料。
若要從 Azure 數據總管 Web UI 存取精靈:
- 開始之前,請使用下列步驟來取得查詢和數據擷取端點。
在 Synapse Studio 的左側窗格上,選取 [管理] [資料總管集區]>。
選取您想要使用的 [資料探索器] 集區以查看其詳細資訊。
記下查詢和數據擷取端點。 設定數據總管集區的連線時,請使用查詢端點作為叢集。 設定數據擷取的 SDK 時,請使用資料擷取端點。
- 在 Azure 數據總管 Web UI 中,新增 查詢端點的連線。
- 從左側功能表中選取 [查詢 ],以滑鼠右鍵按兩下 資料庫 或 數據表,然後選取 [內嵌新數據]。
- 開始之前,請使用下列步驟來取得查詢和數據擷取端點。
一鍵匯入精靈
備註
本節說明使用事件中樞作為數據源的精靈程式。 您也可以使用這些步驟從 Blob、檔案、Blob 容器和 ADLS Gen2 容器擷取數據。
以 Synapse 工作區的實際值取代範例值。
在 [ 目的地] 索引標籤上,選擇內嵌數據的資料庫和數據表。
在 來源 索引標籤上:
選取 [事件中樞 ] 作為擷取的來源 類型 。
使用下列資訊填寫事件中樞資料連線詳細資料:
Setting 範例值 Description 資料連線名稱 ContosoDataConnection 事件中樞數據連線的名稱 Subscription Contoso_Synapse 事件中樞所在的訂用帳戶。 偶數中樞命名空間 contosoeventhubnamespace 事件中樞的命名空間。 取用者群組 contosoconsumergroup Even Hub 取用者群組的名稱。
選取 下一步。
模式映射
服務會自動產生您可以變更的架構和擷取屬性。 您可以使用現有的映射結構或建立新的結構,這取決於您是匯入到新的還是現有的資料表格。
在 [ 架構] 索引標籤中,執行下列動作:
檔案格式
單鍵匯入支持從所有 Data Explorer 支援的數據格式中匯入源數據。
編輯器視窗
在 [架構] 索引標籤的 [編輯器] 視窗中,您可以視需要調整資料表數據行。
您可以在資料表中進行的變更取決於下列參數:
- 表格類型是全新或現有的
- 映射類型是新的或現有的
| 數據表類型 | 映射類型 | 可用的調整 |
|---|---|---|
| 新增資料表 | 新映射 | 變更數據類型、重新命名數據行、新增資料行、刪除資料行、更新資料行、升序、排序遞減 |
| 現有的資料表 | 新映射 | 新的數據行(然後您可以變更數據類型、重新命名和更新), 更新欄位、升序、降序 |
| 現有的映射 | 遞增排序、遞減排序 |
備註
新增資料行或更新資料行時,您可以變更映射轉換。 如需更多資訊,請參閱 映射轉換
映射變換
某些資料格式映射 (Parquet、JSON 和 Avro) 支援簡單的匯入時轉換。 若要套用對應轉換,請在 編輯器視窗中建立或更新欄位。
對應轉換可以在 類型 字串或日期時間的數據行上執行, 其中Source 具有數據類型int或long。 支援的對應轉換如下:
- 從Unix秒獲取日期時間
- 從Unix毫秒獲取日期時間
- 從Unix微秒獲得日期時間
- DateTimeFromUnixNanoseconds (從 Unix 納秒獲取日期時間)
資料提取
完成架構對應和欄位操作之後,匯入精靈會啟動數據匯入過程。
從 非容器 來源擷取數據時,擷取將會立即生效。
如果您的資料來源是 容器:
- 數據總管的 批處理原則 將會匯總您的數據。
- 擷取之後,您可以下載擷取報告,並檢閱已處理之每個 Blob 的效能。
初始數據探索
擷取之後,精靈可讓您選擇使用 快速命令 來初始探索數據。