共用方式為


Microsoft Purview 資料對應的定價

本指南涵蓋傳統 Microsoft Purview 治理入口網站中 Microsoft Purview 資料對應的定價指導方針。

如需 Microsoft Purview (先前稱為 Azure Purview) 的完整定價指導方針詳細資料,請參閱 定價指導方針概觀。

如需特定價格詳細資料,請參閱 Microsoft Purview (先前稱為 Azure Purview) 定價頁面。 本文將引導您了解影響資料對應定價的功能和因素。

影響資料對應定價的直接成本是根據下列三個維度:

彈性資料對應

  • 數據對應是 Microsoft Purview 治理入口網站架構的基礎,因此在任何指定時間點,都必須使用數據資產中的資產資訊。

  • 資料對應會以 容量單位 (CU) 計費。 如果目錄儲存最多 10 GB 的中繼資料儲存體,且每秒最多可執行 25 個資料對應作業,則會在一個 CU 佈建資料對映。

  • 首次建立帳戶時,資料對映一律會在一個CU佈建。

  • 不過,資料對映會在該彈性視窗的最小和最大限制之間自動調整,以因應資料對映中兩個關鍵因素 - 作業輸送量中繼資料儲存體的變更。

作業輸送量

  • 以在資料對映上執行的「建立」、「讀取」、「更新」、「刪除」作業為基礎的事件驅動因素
  • 資料對映作業的一些範例如下:
    • 在資料對映中建立資產
    • 將關係新增至資產,例如擁有者、管理人、母項、譜系
    • 編輯資產以新增商業中繼資料,例如說明、詞彙術語
    • 關鍵字搜尋將結果傳回至搜尋結果頁面
    • 使用 API 匯入或匯出資訊
  • 如果在資料對應上執行多個查詢,則 I/O 作業的數目也會增加,導致資料對應的相應放大
  • 並行使用者數目也會形成控制資料對映容量單位的因素
  • 其他需要考慮的因素包括搜尋查詢類型、API 互動、工作流程、核准等
  • 資料爆發層級
    • 當需要更多作業/秒輸送量時,資料對應可以在彈性視窗內自動調整,以符合變更的負載
    • 這構成了需要估計和規劃的爆發特性
    • 突發特性包括突發水平和突發存在的突發持續時間
      • 爆發水平是穩態下預期一致彈性的乘法指數
      • 高載持續時間是由於資料對應上增加的中繼資料或更多作業而預期的彈性) 此類高載在彈性中 (的月份百分比

中繼資料儲存

  • 如果資料資產中的資產數目減少,然後透過後續的增量掃描在資料對映中移除,則儲存體元件會自動減少,因此資料對映會縮減

自動掃描、分類和擷取

有兩個主要的自動化程式可以觸發將中繼資料擷取至 Microsoft Purview 資料對應:

  • 使用原生 連接器進行自動掃描。 此過程包括三個主要步驟:

    • 中繼資料掃描
    • 自動分類
    • 將中繼資料擷取至 Microsoft Purview 資料對應
  • 使用 Azure Data Factory 和/或 Azure Synapse 管線自動擷取。 此程序包括:

    • 如果帳戶連線到任何 Azure Data Factory 或 Azure Synapse 管線,則將中繼資料和譜系擷取至 Microsoft Purview 資料對應。

使用原生連接器自動掃描

  • 完整掃描會處理資料來源所選範圍內的所有資產,而增量掃描會偵測並處理自上次成功掃描以來已建立、修改或刪除的資產

  • 所有掃描 (完整掃描或增量掃描) 都會挑選 更新、修改或刪除的 資產

  • 請務必考慮並避免屬於不同部門的多個人員或群組為相同資料來源設定掃描,導致重複掃描的定價更高的情況

  • 排程在初始完整掃描後進行 頻繁的增量掃描 ,以符合資料資產中的變更。 這可確保資料對應始終保持最新狀態,並且與完整掃描相比,增量掃描消耗的 v 核心小時數更少

  • 資料來源的 「檢視詳細資料」 連結將使用戶能夠執行完整掃描。 不過,請考慮在完整掃描之後執行累加式掃描,以進行最佳化掃描,除非掃描規則集 (分類/檔案類型發生變更,)

  • 父集合中註冊資料來源,並在子集合上使用不同的存取控制進行範圍掃描,以確保沒有重複的掃描成本

  • 使用收集授權,透過精細存取控制資料來源管理員角色,減少允許註冊資料來源進行掃描的使用者。 這可確保只允許註冊有效的數據源,並控制掃描虛擬核心時數,從而降低掃描成本

  • 請考慮資料來源 的類型 和正在掃描的 資產數目 會影響掃描持續時間

  • 建立自訂掃描規則集 ,以僅包含資料資產中可用的 檔案類型 子集,以及與您的業務需求相關的 分類 ,以確保掃描器的最佳使用

  • 為資料來源建立新掃描時,請遵循建議 的準備順序 ,再實際執行掃描。 這包括收集 商務特定分類檔案類型 的需求, (儲存體帳戶的需求) 以啟用要定義適當的掃描規則集,以避免多次掃描,並透過遺漏的需求來控制多次掃描的不必要成本

  • 將您的掃描排程與 Self-Hosted Integration Runtime (SHIR) VM (虛擬機器) 大小保持一致,以避免與虛擬機器相關聯的額外成本

使用 Azure Data Factory 和/或 Azure Synapse 管線自動擷取

  • 每次管線在來源系統中執行時,都會從 Azure Data Factory 或 Azure Synapse 管線擷取中繼資料和譜系。

進階資源集

  • Microsoft Purview 資料對應使用資源集來解決將大量資料資產對應至單一邏輯資源的挑戰,方法是提供掃描資料湖中所有檔案的能力,並尋找 GUID (模式、當地語系化模式等 ) 以將它們分組為資料對應中的單一資產

  • 進階資源集是一項 選用功能,可讓客戶取得計算的豐富資源集資訊,例如總大小、分割區計數等,並透過模式規則自訂資源集分組。 如果未啟用進階資源集功能,整合式目錄仍會包含資源集資產,但沒有彙總屬性。 在此情況下,不會向客戶計費「資源集」計量。

  • 在開啟 Microsoft Purview 資料對應中的進階資源集之前,請先使用基本資源集功能來確認是否符合需求

  • 如果出現以下情況,請考慮開啟進階資源集:

    • 您的資料湖結構描述會不斷變更,而且您正在尋找基本資源集功能以外的更多價值,讓Microsoft Purview 資料對應能夠以服務的形式計算參數,例如 #partitions、資料資產大小等
    • 需要自訂資源集資產的分組方式。
  • 請務必注意,進階資源集的計費是以離線層用來彙總資源集資訊的計算為基礎,而且取決於目錄中資源集的大小/數目

後續步驟