共用方式為


快速入門:使用單鍵擷取資料 (預覽)

這很重要

Azure Synapse Analytics 數據總管 (預覽版) 將於 2025 年 10 月 7 日淘汰。 在此日期之後,將會刪除在 Synapse 數據總管上執行的工作負載,且相關聯的應用程式數據將會遺失。 強烈建議移轉至 Microsoft Fabric 中的 Eventhouse

Microsoft雲端移轉處理站 (CMF) 計劃的設計目的是協助客戶移轉至 Fabric。 此計劃提供客戶實作鍵盤培訓資源,不收取任何費用。 這些資源會指派 6-8 周,並具有預先定義且已同意的範圍。 客戶提名會由 Microsoft 帳戶小組接受,或直接透過向 CMF 小組提交 協助申請 來接受。

單鍵擷取可讓數據擷取程式變得簡單、快速且直覺。 一鍵導入可協助您快速開始導入資料、建立資料庫資料表、映射結構。 從不同來源選取不同數據格式的數據,作為一次性或連續的匯入過程。

下列功能讓單鍵擷取變得如此實用:

  • 由導入向導引導的直覺式體驗
  • 在幾分鐘內匯入數據
  • 內嵌來自不同來源的數據:本機檔案、Blob 和容器(最多 10,000 個 Blob)
  • 匯入各種格式的數據
  • 將數據內嵌至新的或現有的數據表
  • 系統會為您建議資料表映射和結構,且易於變更。

第一次擷取數據或數據架構不熟悉時,單鍵擷取特別有用。

先決條件

  • Azure 訂用帳戶。 建立免費的 Azure 帳戶

  • 使用 Synapse StudioAzure 入口網站建立資料總管集區

  • 建立Data Explorer資料庫。

    1. 在 Synapse Studio 的左側窗格上,選取 [資料]

    2. 選取 + (新增資源) >[資料總管集區],並使用下列資訊:

      Setting 建議的值 Description
      集區名稱 contosodataexplorer 要使用的 Data Explorer 集區的名稱
      名稱 TestDatabase 資料庫名稱在叢集內必須是唯一而不重複。
      預設保留期限 365 保證資料持續可供查詢的時間範圍 (天)。 時間範圍是從資料被導入的時間開始測量的。
      預設快取期間 31 在 SSD 儲存裝置或 RAM 中 (而非長期儲存裝置),讓受到頻繁查詢的資料維持可用狀態的時間範圍 (天)。
    3. 選取 [建立] 以建立資料庫。 建立時間通常不到一分鐘。

  • 建立數據表

    1. 在 Synapse Studio 的左側窗格上,選取 [開發]
    2. KQL 指令碼下方,選取+ (新增資源) >[KQL 指令碼]。 您可以在右側窗格上命名指令碼。
    3. 連線至 選單中,選取 contosodataexplorer
    4. 在 [使用資料庫] 功能表中,選取 [TestDatabase]
    5. 貼上下列命令,並選取 [執行] 以建立資料表。
    .create table StormEvents (StartTime: datetime, EndTime: datetime, EpisodeId: int, EventId: int, State: string, EventType: string, InjuriesDirect: int, InjuriesIndirect: int, DeathsDirect: int, DeathsIndirect: int, DamageProperty: int, DamageCrops: int, Source: string, BeginLocation: string, EndLocation: string, BeginLat: real, BeginLon: real, EndLat: real, EndLon: real, EpisodeNarrative: string, EventNarrative: string, StormSummary: dynamic)
    

    小提示

    確認資料表已成功建立。 在左側窗格上,選取 資料,然後在 contosodataexplorer 的更多選單中選取 重新整理。 在 contosodataexplorer 下方,展開 [資料表],確認 StormEvents 資料表出現在清單中。

存取單鍵精靈

單鍵擷取向導會逐步引導您完成簡便的單鍵擷取流程。

  • 若要從 Azure Synapse 存取精靈:

    1. 在 Synapse Studio 的左側窗格上,選取 [資料]

    2. 在 [數據總管資料庫]下,以滑鼠右鍵按兩下相關的資料庫,然後選取 [在 Azure 數據總管中開啟]。

      螢幕擷取畫面:顯示在特定集區的內容中開啟 Azure 資料總管的 Azure Synapse Studio。

    3. 以滑鼠右鍵按兩下相關的集區,然後選取 [內嵌新數據]。

  • 若要從 Azure 入口網站存取精靈:

    1. 在 Azure 入口網站中,搜尋並選取相關的 Synapse 工作區。

    2. [數據總管集區] 底下,選取相關的集區。

    3. 歡迎來到資料探索者池 主畫面上,選取 引入新資料

      Azure 入口網站的螢幕快照,其中顯示在特定集區的內容中開啟 Azure 資料瀏覽器。

  • 若要從 Azure 數據總管 Web UI 存取精靈:

    1. 開始之前,請使用下列步驟來取得查詢和數據擷取端點。
      1. 在 Synapse Studio 的左側窗格上,選取 [管理] [資料總管集區]>

      2. 選取您想要使用的 [資料探索器] 集區以查看其詳細資訊。

        [數據總管集區] 畫面的螢幕快照,其中顯示現有集區的清單。

      3. 記下查詢和數據擷取端點。 設定數據總管集區的連線時,請使用查詢端點作為叢集。 設定數據擷取的 SDK 時,請使用資料擷取端點。

        [數據總管] 集區屬性窗格的螢幕快照,其中顯示查詢和數據擷取 URI 位址。

    2. 在 Azure 數據總管 Web UI 中,新增 查詢端點的連線
    3. 從左側功能表中選取 [查詢 ],以滑鼠右鍵按兩下 資料庫數據表,然後選取 [內嵌新數據]。

一鍵匯入精靈

備註

本節說明使用事件中樞作為數據源的精靈程式。 您也可以使用這些步驟從 Blob、檔案、Blob 容器和 ADLS Gen2 容器擷取數據。

以 Synapse 工作區的實際值取代範例值。

  1. 在 [ 目的地] 索引標籤上,選擇內嵌數據的資料庫和數據表。

    Azure 數據探索器單鍵匯入精靈的螢幕快照,顯示資料庫和資料表的選擇。

  2. 來源 索引標籤上:

    1. 選取 [事件中樞 ] 作為擷取的來源 類型

      Azure 資料探索器單鍵匯入精靈的螢幕快照,其中顯示選擇來源類型。

    2. 使用下列資訊填寫事件中樞資料連線詳細資料:

      Setting 範例值 Description
      資料連線名稱 ContosoDataConnection 事件中樞數據連線的名稱
      Subscription Contoso_Synapse 事件中樞所在的訂用帳戶。
      偶數中樞命名空間 contosoeventhubnamespace 事件中樞的命名空間。
      取用者群組 contosoconsumergroup Even Hub 取用者群組的名稱。

      Azure 數據總管單鍵擷取精靈的螢幕快照,其中顯示事件中樞連線詳細數據。

    3. 選取 下一步

模式映射

服務會自動產生您可以變更的架構和擷取屬性。 您可以使用現有的映射結構或建立新的結構,這取決於您是匯入到新的還是現有的資料表格。

在 [ 架構] 索引標籤中,執行下列動作:

  1. 確認自動產生的壓縮類型。
  2. 選擇 數據的格式。 不同的格式可讓您進行進一步的變更。
  3. [編輯器] 視窗中變更對應。

檔案格式

單鍵匯入支持從所有 Data Explorer 支援的數據格式中匯入源數據。

編輯器視窗

在 [架構] 索引標籤的 [編輯器] 視窗中,您可以視需要調整資料表數據行。

您可以在資料表中進行的變更取決於下列參數:

  • 表格類型是全新或現有的
  • 映射類型是新的或現有的
數據表類型 映射類型 可用的調整
新增資料表 新映射 變更數據類型、重新命名數據行、新增資料行、刪除資料行、更新資料行、升序、排序遞減
現有的資料表 新映射 新的數據行(然後您可以變更數據類型、重新命名和更新),
更新欄位、升序、降序
現有的映射 遞增排序、遞減排序

備註

新增資料行或更新資料行時,您可以變更映射轉換。 如需更多資訊,請參閱 映射轉換

映射變換

某些資料格式映射 (Parquet、JSON 和 Avro) 支援簡單的匯入時轉換。 若要套用對應轉換,請在 編輯器視窗中建立或更新欄位。

對應轉換可以在 類型 字串或日期時間的數據行上執行, 其中Source 具有數據類型int或long。 支援的對應轉換如下:

  • 從Unix秒獲取日期時間
  • 從Unix毫秒獲取日期時間
  • 從Unix微秒獲得日期時間
  • DateTimeFromUnixNanoseconds (從 Unix 納秒獲取日期時間)

資料提取

完成架構對應和欄位操作之後,匯入精靈會啟動數據匯入過程。

  • 非容器 來源擷取數據時,擷取將會立即生效。

  • 如果您的資料來源是 容器

    • 數據總管的 批處理原則 將會匯總您的數據。
    • 擷取之後,您可以下載擷取報告,並檢閱已處理之每個 Blob 的效能。

初始數據探索

擷取之後,精靈可讓您選擇使用 快速命令 來初始探索數據。

後續步驟