共用方式為


資料控管的範例設定

Microsoft Purview 資料控管具有 Microsoft Purview 整合式目錄和 Microsoft Purview 資料對應,可提供全面的可見度、資料信心和負責任的創新,協助組織在 AI 時代實現更大的商業價值。 使用管理健康情況數據的範例,請遵循本文中的步驟,以協助您瞭解如何設定整合式目錄,並使用其功能為您的組織建置健全的數據控管做法。

步驟 1:在整合式目錄中設定您的治理網域

治理網域是建立資料責任的關鍵,並有助於在整個公司中聯合該資料的治理。 當您建立控管網域時,請從適當的擁有者開始,以確保您可以有效地識別資料資產中所有資料並與專家共同作業。 治理網域可以是許多不同的類型,以符合控管該資料之小組的資料界限類型。 例如:財務、人力資源、銷售) (功能域,或產品、客戶、健康) (資料域。

必要條件

授與權限並建置第一個治理網域

  1. 開啟 Microsoft Purview 入口網站

  2. 使用具有 角色管理 (角色之系統管理員帳戶的認證登入 Microsoft Purview 入口網站,例如,Purview 系統管理員) 。 移至 設定 > 要 檢視和管理的角色和範圍。

  3. 選取 [角色群組]。

  4. [Microsoft Purview 解決方案的角色群組 ] 頁面上,選取 [ 資料控管 ] 角色群組。

  5. [編輯角色群組的成員 ] 頁面上,選取 [ 選擇使用者 ] 或 [ 選擇群組]。

  6. 選取您要新增至角色群組的所有使用者或群組的核取方塊。

  7. 選取 選取

  8. 在整合式目錄中,選取目錄管理,然後選取治理網域

  9. 控管網域 頁面上,您可以設定目錄的其餘部分,讓其他人能夠聯合資料的所有權、讓團隊能夠建立其知識,以及建立資料的商業價值。

    1. 首先選取 [新增控管網域]。
      1. 您可以更新治理網域的名稱。 在本教程中,將其命名為“個人健康 (教程) ”,並給出“個人健康數據是指在醫療保健部門內收集和使用的與個人身心健康相關的任何信息。 這些數據可以包括多種類型,例如病歷、治療史、診斷影像和實驗室測試結果。 它通常受到各種法律法規的保護,以確保隱私和機密性。
      2. 選取類型作為「資料網域」。
      3. 將母項保留空白 (如果這是型錄中的第一個控管網域,則它沒有母項) 。
      4. 選取 [建立]
      5. 現在,您可以自己再建立兩個網域。 這些網域是組織中共同作業和治理的同盟關鍵點。 當您實作整合式目錄時,請考慮誰可能是網域的擁有者。
        1. 您可以按照以下範例操作:
        • 公司功能網域代表整個公司使用的高度控制資產和術語。 - 銷售 是大多數組織都擁有的功能領域,作為公司的子領域。
  10. 選取您建立的控管網域。

  11. 選取治理網域的 角色 索引標籤。

  12. 依預設,當您建立治理網域時,會將您新增至治理網域中的所有角色。 身為控管網域擁有者,您可以新增網域) 中的資料管理員 (業務專家,以及知道哪些資料資產最適合其他人取用) 的資料產品擁有者 (。

  13. 切換回 [詳細資料] 索引標籤。

  14. 選取 [管理原則] 以套用網域層級原則。 此原則適用於網域中的所有資料產品。 透過啟用原則的自動套用,資料專家不必也是原則專家。

  15. [管理存取原則] 索引標籤中,選取 [允許資料複本] 旁的核取方塊。選取此原則選項,它會自動套用證明,要求要求存取資料產品的所有使用者,以證明他們瞭解資料的資料複製原則。

  16. 選取 [ 儲存變更 ] 以確認原則是由治理網域設定。

  17. 選取 [在治理網域上 發佈] ,這會發佈網域內的所有其他概念。

建立詞彙術語

將詞彙術語新增至您的治理網域,可協助其他人瞭解企業如何使用及解譯資料。 詞彙術語也可確保深入解析使用一般術語,以及您在整個治理領域的知識。

  1. 在您的治理網域頁面上,尋找 [詞彙表術語 ] 卡片,然後選取 [ 檢視全部]。

  2. [詞彙表術語 ] 頁面上,選取 [新增術語]。

  3. 輸入詳細資料: 1. 名稱:「爆發」。

    1. 描述:一種影響或有可能影響大部分人口的疾病。
    2. 您現在可以將其餘部分留空,但有一些字段需要收集:負責為您的公司定義術語的術語所有者、要共享的首字母縮略詞(也稱為術語名稱),最後,您可以提供指向資源的鏈接,這些資源將包含有關該術語的更多信息。
  4. 選取 [建立]

  5. 選取 [管理原則]。 與網域層級原則類似,您可以建立套用在使用術語的任何位置的字詞層級原則。

  6. 勾選 [需要管理員核准] 旁邊的方塊。 當要求存取資料產品時,此原則會強制執行 Microsoft Entra ID 中使用者管理員的次要核准。

  7. 選取 Publish 以 取得已建立的爆發字詞。 已發佈的字詞可在整合式目錄中篩選,並確保使用該術語來描述其資料產品的其他人可以在瀏覽資料產品時在整合式目錄中看到該描述。

  8. 現在再建立兩個術語。 這次,選取「爆發」字詞作為您建立之字詞的父字詞。 嘗試在任一術語的相關選項卡中建立這些子術語之間的關係,以幫助建立這些術語如何協同工作以解釋整個主題的網絡。

    1. 大流行:影響多個國家/地區或大陸大量人群的疾病在全球爆發。
    2. 流行病:一種具有高度傳染性並影響大部分人口的疾病在全國或區域範圍內爆發。
  9. 嘗試在您先前建立的任何其他網域中建立幾個其他字詞。 如果您不確定要新增什麼內容,請選取 [ 取得建議的字詞 ] ,讓生成式 AI 根據您已提供的網域的描述和名稱提出一些建議。

新增 OKR

為您的個人健康領域新增 OKR (目標和關鍵結果) ,以協助其他人瞭解您數據的商業價值。 此步驟會在資料與其提供的商業價值之間建立直接連線。

  1. 從治理網域頁面選取 [OKR ] 方塊。

  2. 選取 [新增 OKR]。

  3. 首先輸入目標的詳細信息:

    1. 目標:通過讓患者有效接種疫苗來降低大流行風險。
    2. 所有者:輸入您的姓名
    3. 目標日期:「2024-12-31」
  4. 選取 [建立]

  5. 將關鍵結果新增至您的目標,以使目標可衡量並監控實現目標的進度。 選取 [新增關鍵結果]。

  6. 輸入關鍵結果詳細資料:

    1. 主要結果:確保 80% 最有可能受到大流行影響 (65 歲) >的老年人群在 2024 年底前接種全面疫苗。
    2. 進度狀態:步入正軌
    3. 進度量:70
    4. 目標金額:80
    5. 最高金額:100
  7. 選取 [建立]

  8. 選取 [發佈]

建立關鍵資料元素

在Personal Health中建立關鍵資料元素 (CDE) ,以確保最重要的資料欄具有一致的定義和理解。 CDE 始終滿足資料形成和儲存方式的業務期望。

  1. 從選取「個人健康情況」網域的「控管網域」頁面中,選取 「重要資料元素」 方框。
  2. 選取 新增重要資料元素
  3. 輸入基本 CDE 中繼資料:
    1. 名稱:年齡組
    2. 描述:用於確保所需的分析報告遵循其他人可以依賴的參考的人員年齡的常見分組,並刪除個人年齡以提高數據的匿名性。 年齡組分為八組: <2歲、2-4歲、5-11歲、12-17歲、18-24歲、25-49歲、50-64歲、65+歲。
    3. 所有者:輸入您的姓名
    4. 預期資料類型:文字
    5. 選取 [建立]

CDE 的真正功能在於它直接對應到儲存此資料的實體資料列。 這種連接可確保共同理解,並能夠大規模評估資料品質規則和原則。

  1. 從您剛建立的 CDE 中,選取 [新增資料行]。

  2. 從資料湖的黃金容器中搜尋 Covid 19 疫苗和病例趨勢 資料資產

  3. 選取 Covid 19 疫苗和病例趨勢 資產的方塊,而不是名稱。

    提示

    如果您選取資產的藍色名稱,則會開啟一個新視窗,顯示資產詳細資料。

  4. 選取 AgeGroupVacc 欄旁的選項按鈕。

  5. 選取 新增

  6. 選取您剛建立的 CDE 頂端的 [資料品質 ] 索引標籤,以將資料品質規則套用至 CDE。 這類似於您新增詞彙表術語和治理網域的原則的方式。

  7. 選取 [新增規則]

  8. 選取 [資料類型比對]

  9. 輸入規則名稱:確認年齡群組格式

  10. 選取 [建立]

  11. 選取 [在 CDE 上發佈]

此 CDE 現在會自動將資料品質規則套用至使用 Covid 19 疫苗和案例趨勢資產的每個資料產品,您會在下一節中看到。

  1. 嘗試在其他網域中建立幾個其他 CDE。 這裡有一些想法:
    • 銷售:收入和賣家名稱
    • 公司:產品編號

步驟 2:在資料地圖中設定和註冊您的資料

如果您沒有可供掃描的資料來源,請遵循下列步驟來完整部署 Azure Data Lake Storage (ADLS Gen2 範例) 。

提示

如果您已在與 Microsoft Purview 帳戶相同的租用戶中擁有數據源,請繼續進行本節的下一部分以掃描您的資產。

在真實資料資產中,您會發現許多不同的系統用於不同的資料應用程式。 有 Fabric 和 Snowflake 等報告環境,其中團隊使用數據副本來構建分析解決方案並為其報告和儀表板提供支持。 有一些營運資料系統可為團隊或客戶用來完成業務流程的應用程式提供支援,這些業務流程根據流程中做出的決策收集或新增資料。

若要建立更真實的資料資產,請在目錄中顯示許多資料來源,這些來源可以涵蓋任何公司可能具有的不同資料用途的廣度。 支援使用案例所需的資料類型可能大不相同,業務使用者需要報告和儀表板,分析師需要符合一致的維度和事實來建立報告,資料科學家或資料工程師需要直接來自收集資料的系統的原始來源資料。 所有這些以及更多功能使不同的用戶能夠看到在同一個地方查找、理解和訪問數據的重要性。

如需將資料新增至資產的其他教學課程,請遵循下列指南:

必要條件

設定您的資料資產

答: 建立並填入儲存體帳戶
  1. 請遵循本指南來建立儲存體帳戶:建立 Azure Data Lake Storage Gen2 的儲存體帳戶
  2. 為您的新資料湖建立容器:
    1. 移至儲存體帳戶的 [ 概觀 ] 頁面。
    2. 選取 [資料儲存] 區段下的 [容器] 索引標籤。
      1. 選取 [容器]。
      2. 將容器命名為「青銅」,然後選取 [建立]。
      3. 重複這些步驟以建立「黃金」容器。
  3. 從 data.gov 下載一些示例 CSV 數據:按年齡組劃分的 Covid-19 疫苗接種和病例趨勢,美國
  4. 將 CSV 上傳至您建立的儲存體帳戶中名為 'bronze' 的容器。
  5. 選取名為「青銅」的容器,然後選取 [上傳]。
  6. 瀏覽您儲存 CSV 的位置,然後選取 Covid-19_Vaccination_Case _Trends 檔案。
  7. 選取 [上傳]
B. 建立 Azure Data Factory

此步驟示範資料如何在獎章資料湖的各層之間移動,並確保資料採用消費者預期使用的標準化格式。 此步驟是執行資料品質的先決條件。

  1. 請遵循本指南來建立 Azure Data Factory:建立 Azure Data Factory

  2. 使用此 Azure Data Factory 指南,將資料從 'bronze' 容器中的 CSV 複製到 'gold' 容器,做為差異格式資料表:使用對應資料流程轉換資料

  3. Azure 入口網站開啟Azure Data Factory (ADF) 體驗,方法是在所建立的 ADF 資源的 [概觀] 索引標籤上選取 [啟動工作室]。

  4. 選取 ADF Studio 中的 [作者] 索引標籤。

  5. 選取命令 + ,然後選取 資料流程

  6. 將資料流程命名為 'CSVtoDeltaC19VaxTrends'。

  7. 選取空白方塊中的新增 來源

  8. 將來源設定設定為:

    1. 輸出串流名稱:「C19csv」
    2. 描述:留空
    3. 來源類型:內嵌
    4. 內嵌資料集類型:分隔文字
    5. 連結服務:選取您儲存 csv 的資料湖
  9. 將 [來源選項] 設定為:

    1. 檔案模式:檔案
    2. 檔案路徑:/bronze/ Covid-19_Vaccination_Case _Trends
    3. 不允許找不到檔案:未勾選
    4. 變更資料擷取:未勾選
    5. 壓縮類型:無
    6. 編碼:預設 (UTF-8)
    7. 欄分隔符號:逗號 (,)
    8. 列分隔符號:預設 (\r、\n 或\r\n)
    9. 引號字元:雙引號 (“)
    10. 轉義字元:反斜線 ()
    11. 第一行作為標題:CHECKED
    12. 將其餘部分保留為預設值
  10. 依建立的來源選取 下一步 ,然後選取 接收

  11. 建立接收器,其中要儲存資料的格式和位置,以將資料從「青銅」的 csv 移至「金色」的差異資料表。

    1. 設定接收器值 (除非) 指定,否則將所有設定保留為預設值。
    2. 水槽類型:內嵌。
    3. 內嵌資料集類型:Delta。
    4. 連結服務:與來源中使用的相同資料湖,因為您儲存在不同的容器中。
  12. 設定設定值 (除非指定,否則所有設定都保留為預設值)

    1. 文件夾路徑:黃金/Covid19 疫苗和病例趨勢。
  13. 輸入值,因為此名稱是您要儲存資料的方式,而且不存在可供選取。

  14. 選取 [驗證]。 此動作會檢查您的資料流程,並提供修正任何錯誤的指示。

  15. 選取 [全部發佈]。

  16. 選取命令+,然後選取管線。

  17. 將您的管道命名為「CSV 到 Delta C19 Vax 趨勢」。

  18. 選取在先前步驟中建立的資料流程 CSV 至 Delta (C19VaxTrends) ,然後將其拖放到 [開啟的管線] 索引標籤上。

  19. 選取 [驗證]。

  20. 選取 [發佈]

  21. 選取 偵錯 ( 使用活動執行階段) 來執行管線。

    提示

    如果您收到空格錯誤或差異格式不適當的字元,請開啟下載的 CSV 並進行更正。 然後重新上傳並覆蓋青銅區中的 CSV。 然後重新執行管線。

  22. 流覽至資料湖中的黃金容器,您現在應該會看到在管線期間建立的新 Delta 資料表。

掃描您的資產

如果您尚未將資料資產掃描到資料對應中,請遵循下列步驟來填入資料對應。

掃描資料資產中的來源會自動收集資料資產的中繼資料 (資料表、檔案、資料夾、報表,以及這些來源中的更多) 。 當您登錄資料來源並建立掃描時,您可以建立型錄中顯示之來源及資產的技術擁有權。 您也可以控制誰可以存取 Microsoft Purview 中的哪些中繼資料。 當您在網域層級註冊和儲存來源和資產時,您會將它們儲存在存取階層的最高層級。 一般而言,最好建立一些集合,您可以在其中掃描資產中繼資料,並為該資料建立正確的存取階層。

如果您選擇使用 Fabric 或 SQL,請使用下列指南來提供存取權:

註冊您的資料湖並掃描您的資產

  1. 在 [資料對應] 索引標籤下,選取網域的 [角色指派 ] (它是 Purview 帳戶Microsoft名稱) :

    1. 將自己新增為資料來源管理員和資料策展人至網域。
      1. 選取角色 [資料來源管理員] 旁邊的人員圖示。1. 搜索您在 ID Microsoft Entra中的姓名 (您可能需要輸入與您的 ID) 中的拼寫完全相同的全名Microsoft Entra。
      2. 選取 [確定]
      3. 針對資料策展人重複這些步驟。
  2. 註冊資料湖:

    1. 選取 [資料來源] 索引標籤。
    2. 選取 [登錄]
    3. 選取 Azure Data Lake Storage Gen2 儲存體類型。
  3. 提供要連接的詳細信息:

    1. 訂閱 (可選)
    2. 資料來源名稱 (這是 ADLS Gen2 來源) 的名稱
    3. 資產中繼資料應儲存 (選用) 的集合
    4. 選擇 註冊
  4. 資料來源註冊完成後,您可以配置掃描。 註冊表示 Microsoft Purview 已連線到數據源,並已將它放在正確的集合中以取得擁有權。 掃描會從來源讀取中繼資料,並在資料對應中填入資產。

  5. 選擇您在資料來源標籤中註冊的來源

  6. 選取新的掃描並提供詳細資料:

    1. 使用此掃描的預設整合執行階段
    2. 認證應該Microsoft Purview MSI (系統)
    3. 掃描級別為自動檢測
    4. 選取集合或使用網域 (集合必須與資料來源註冊位置的集合或子集合相同)
    5. 選取 [繼續]

    提示

    此時會測試連線,以驗證是否可以完成掃描。 如果您未授與 Microsoft Purview MSI 讀取者數據源的存取權,則會失敗。 如果您不是資料來源擁有者或沒有使用者存取參與者,則掃描會失敗,因為它預期您有建立連線的授權。

  7. 現在只選取您在教學課程的建置資料區段中放置差異資料表的容器「金色」。 此選項可防止掃描資料儲存庫中的任何其他資料資產。

    1. 金色旁邊應該只有一個藍色支票,您可以在所有內容旁邊留下支票,因為它會掃描完整的來源並仍然創建我們將使用的資產等等。
    2. 選取 [繼續]
  8. 在選取掃描規則集畫面中,您應該使用預設掃描規則集。

  9. 選取 [繼續]

  10. 在設定掃描觸發程式中,您將設定掃描的頻率,以便在您繼續將資料資產新增至湖的黃金容器時,它會繼續填入資料對應。 選取 一次

  11. 選取 [繼續]

  12. 選取 [儲存並執行]。 此動作會建立掃描,從資料湖的黃金容器讀取中繼資料,並填入我們將在下一節中整合式目錄中使用的資料表。 如果您只選取儲存,則不會執行掃描,而且您看不到資產。 掃描執行之後,您會看到您建立的掃描,其 [上次執行] 狀態為 [已排入佇列]。 掃描讀取完成時,您的資產已準備好進行下一節。 此程序可能需要幾分鐘或幾小時,視來源中有多少資產而定。

步驟 3:發佈您的資料產品

建立資料產品對於確保您的組織能夠發現正確的資料至關重要。 資料產品有助於防止在資料資產中價值低或沒有價值的過度控管資料,因為它沒有用途或價值有限。 當您的資料專家發佈資料產品時,您會啟用最有價值的資料,並根據該值建置適當的治理層級。 策劃技術團隊不知道其業務用途的資產,或嘗試管理複雜且不斷增長的數據資產中的所有內容,會導致額外的時間和生產力損失,以追蹤可能永遠不會使用或可能只是從資產中刪除的數據詳細信息。 相反,應專注於具有價值且人們需要發現和建立更多價值的資料片段。 隨著團隊使用更多資料並更了解需求,您可以建立更多有用的資料產品來滿足這些需求。 治理可以進行調整,以確保它始終根據資料的價值和敏感度保持正確的大小。

必要條件

建立和發佈資料產品

  1. 開啟 Microsoft Purview 入口網站

  2. 選取 [整合式目錄]。

  3. 選取 目錄管理 ,然後選取治理 網域

  4. 控管網域 頁面中,選取 個人健康 網域。

  5. 選取 [商務概念] 底下的 [移至資料產品]。

  6. 這是稱為數據產品擁有者的數據專家會識別組織中其他人要取用的數據資產,並提供必要的資訊以使其可用。

  7. 選取 [新增資料產品]。

  8. 提供有關數據產品的詳細信息: 1. 名稱:“Covid-19 疫苗接種和按年齡劃分的病例趨勢” 1.描述: “這些數據來自美國衛生 & 公共服務部下屬的疾病預防控制中心。 該數據包含美國國家層面按年齡組劃分的疫苗接種和病例趨勢。 數據按至少一劑並完全接種疫苗進行分層。 數據還代表所有疫苗合作夥伴,包括管轄合作診所、零售藥房、長期護理機構、透析中心、聯邦緊急事務管理局和衛生資源和服務管理局合作夥伴站點以及聯邦實體設施。

    1. 類型:資料集
    2. 選取 [下一步]
    3. 應用案例: This data is provided for public use and is intended to help understand the trends of vaccination up take and new cases by different age groups. The ages are banded into two groups ranging from <2 years to 65+ years. Similarly the trends are provided in daily numbers that provide seven day average of new cases by age group.
    4. 將標示為 已核 取的已背書。
    5. 選取 [儲存]
  9. 現在您已經建置了資料產品的基本中繼資料。接下來,新增一些屬性,並從資料對應對應資產。

  10. 選取 新增資料資產

  11. 您會看到您掃描到資料對應中的資產,包括資料來源的所有資料夾和圖層。

  12. 搜尋您新增至資料湖黃金容器的 Covid19 疫苗和病例趨勢 資產,然後選取此資源集。

  13. 選取 新增。 您可以視需要選取資料產品的資產數量,但這裡只需要一個。

    提示

    選取 [ 取得建議 ],讓生成式 AI 協助從資料地圖中的資產中挑選,並從縮減的結果清單中選取 Covid19 疫苗和案例趨勢。

  14. 您現在可以看到新增至資料產品的資產。

  15. 選取詞彙表術語標題旁的 新增術語

  16. 選取先前建立的爆發詞彙,然後選取 [新增]。

  17. 您應該會看到資產中年齡群組的重要資料元素現在已對應至資料產品。

  18. 選取 [OKR 標題] 旁的 [ 新增 OKR ]。

  19. 選取 [透過啟用有效的病患疫苗接種來降低大流行風險]。 這是您在 第一節中建立的目標。

管理資料產品存取要求原則

在頁面頂端,發佈資料產品之前的最後一個步驟是選取 [ 管理原則]。 在這裡,您可以透過進行選取並提供核准名稱來設定存取原則和要求存取工作流程。 您也可以使用 [繼承的原則] 索引標籤來查看針對您稍早套用的資料複本證明套用的控管網域原則。 對於來自 Outbreak 詞彙表術語所需的 經理核准 也是如此。

  1. 選取 [管理原則] 索引標籤。

  2. [存取時間限制] 底下,提供存取要求在需要續約之前有效的詳細資料。 設定此值可授與最多一年的存取權。

  3. 在方塊中輸入 1。

  4. 在下拉式清單中選取年份。

  5. 在核准要求下,在核准者方塊中提供您的姓名。 (它需要在 Microsoft Entra ID 中註冊的姓名 )

    注意事項

    您不需要檢查經理核准,因為該原則是繼承自爆發詞彙表術語。

  6. 選取 預覽請求表單 以查看目錄取用者在請求存取時檢視的內容。 您會看到所需的資料副本證明及經理核准,因為它們是由控管網域及詞彙術語所設定。

  7. 選取 [儲存變更]

對應資料資產並設定存取原則之後,您就可以將資料產品發佈至目錄。

  1. 在資料產品上選取 [發佈]。

  2. 嘗試在您之前建立的其他網域中建立利潤報告

    1. 利潤報告,類型:儀表板/報告。
    2. 產品主資料,類型:Maser 資料及參照資料。

注意事項

您可以將許多資產新增至這些資產,並查看具有許多資產的資料產品的外觀。 將資料產品新增至任何網域的術語,以查看如何使用詞彙表來使用一組一致的術語來描述資料。

步驟 4:執行資料品質

現在您在目錄中已有可用的資料產品,執行資料品質規則會告訴每個人資料狀況良好且可供使用。 當您進一步瞭解資料時,請新增資料品質規則,以確保其適合所有使用案例。 確保資料產品具有最高品質有助於建立對資料的信任,並向其他人顯示您正在監控和改進資料。 隨著資料價值的增加,您需要更密切地監控和控制該資料的品質。 管理不善的資料品質問題可能會造成重大負面影響。

必要條件

  • 資料品質規則只能在 ADLS Gen2 和 Microsoft Fabric 中的差異格式資料表上執行。
  • 必須啟用來自 Microsoft Purview 的受控識別,才能讀取數據源,因為它是目前唯一支援的數據品質認證。
  • 您必須在執行資料品質的治理網域中具有 資料品質管理員角色
  • 您必須是您要連接資料品質掃描之資料來源的擁有者或具有使用者存取系統管理員存取權,以確保掃描資料的適當安全性授權。
  • 您必須具有 資料設定檔管理員角色 ,才能在資料上執行設定檔。

建立和執行資料品質規則

  1. 開啟 Microsoft Purview 入口網站

  2. 選取 [整合式目錄]。

  3. 選取資料管理下的 [資料品質] 索引標籤。

  4. 選取 在第 1 節中建立的個人健康網域。

  5. 選取 [管理],然後選取 [Connections]。 當您建置此連線時,您可以在該控管網域中的資料來源上執行資料品質掃描。 此步驟可防止團隊在未經適當授權的情況下存取資料知識。

  6. 在連線畫面上選取 新增 以建立新連線:1. 輸入顯示名稱「Personal Health ADLSg2 DQ」。

    1. 選取 Azure Data Lake Storage Gen2 的來源類型。
      1. 輸入 在第 2 節中建立的資料來源的詳細資料。

        注意事項

        認證必須Microsoft Purview MSI (系統) ,才能取得數據品質連線。

      2. 選取 [ 測試連線]。
      3. 測試連線之後,請選取 [提交]。

建立連線後,您就可以執行設定檔並開始建立資料品質規則。 此步驟可確保知道商務規則和適當規則的專家在最重要的資料產品上執行。

  1. 返回 [資料品質] 頁面。
  2. 選取 Personal Health 控管網域。
  3. 選擇第 3 節中內置的 Covid-19 疫苗接種和按年齡劃分的病例趨勢數據產品。
  4. 選取您新增至資料產品的資產。 (它必須採用 第 2 節 中的差異格式,否則資料品質將無法) 執行。
  5. 將資料品質規則套用至資料欄,以評估資料是否符合您的品質預期:
    1. 選取選取所選資產上的 Rules 索引標籤。
    2. 選取 [新增規則]。
    3. 選取 [空白/空白欄位規則]。
    4. 輸入詳細資料:
      • 從欄下拉式清單中選取 AgeGroupVacc 欄
      • 規則名稱:確認疫苗接種年齡組存在
    5. 選取 [建立]
    6. 選取 [新增規則]。
    7. 選取 [資料類型比對]。
    8. 輸入詳細資料。
    9. 選取 [DateAdministered] 資料行。
    10. 選取 [建立]
  6. 選取 [執行資料品質掃描]。

設定檔資料

為您的資料建立設定檔,以查看每個資料行的高階統計資料,並探索可能需要新規則的任何異常。

  1. 在整合式目錄中,選取 [健康情況管理],然後選取 [資料品質]。
  2. 選取 [設定檔資料]。
  3. 核取 [欄名稱] 旁的頂端方塊,以分析所有欄。 系統會建議要分析哪些資料行,您可以選取您知道值得分析的資料行,以協助防止高度敏感資料或您知道填入稀疏的資料上的資料進行分析。
  4. 選取 [執行設定檔]。

掃描完成時,您可以檢閱新資料產品的資料品質分數及設定檔。 目錄的所有使用者都可以看到資料品質分數,因此每個人都知道資料的狀態。

建立資料品質掃描的排程,以確保您持續監控資料品質問題。 設定警示,確保您在消費者受到影響之前解決資料品質問題。

  1. 健康情況管理下,選取 [資料品質]。
  2. 選取您設定資料品質規則的 Personal Health 網域。
  3. [管理] 下拉式清單中,選取 [排程掃描]。
  4. [排程掃描] 頁面上,選取 [新增]。
  5. 新增 概觀 詳細資料
    1. 名稱:個人健康DQ月度評估
    2. 描述:每月掃描 DQ 規則以持續改進。
  6. 選取 [繼續]
  7. 選取掃描範圍
  8. 選中 Covid-19 疫苗接種和按年齡劃分的病例趨勢 數據產品旁邊的框
  9. 選取 [繼續]
  10. 排程掃描以確保它在每個月的最後一天執行
    1. 選取週期
    2. 復發:每一個月一次
    3. 月天數:最後一個月
    4. 排程掃描時間 (UTC) :12:00:00
    5. 在 (UTC) 開始週期:保留為預設值
  11. 選取 [繼續]
  12. 在儲存之前,檢閱掃描的詳細資料,以查看是否有您想要進行的變更。
  13. 選取 [儲存]。 因為您之前觸發了手動掃描,所以現在不需要觸發另一個掃描。 如果您需要新的掃描,請選取 [儲存並執行]。

設定警示

排程資料品質掃描之後,您可以設定警示,以通知監護人有關問題,或在資料品質問題或掃描失敗需要注意時通知監護人。 針對失敗的掃描以及分數下降超過 5% 時設定資料品質警示。

  1. 返回 [資料品質 ] 頁面上的 [個人健康] 網域。
  2. [管理] 下拉式清單中,選取 [警示]。
  3. 選取 [新增]
  4. 輸入警示詳細資料
    1. 顯示名稱:個人健康 DQ 每月掃描
    2. 描述:確保最低 DQ 閾值符合消費者的期望。
    3. 目標:分數下降超過
    4. 門檻:5
    5. 關閉通知:未勾選
    6. 開啟品質掃描失敗的通知:保持核取狀態
    7. 收件人:輸入您的姓名
  5. 選取 [繼續]

提示

在整合式目錄中實作時,請將警示傳送給監護人,他們可以通知取用者問題,並與資料的技術擁有者合作進行更正。

在本節結束時,您有一個具有作業資料品質的正常運作的整合式目錄,可管理您提供給組織資料取用者的資料。 一切都是為了向消費者提供最有價值的數據,並建立對他們使用的數據的信任。 隨著資料價值的成長和新資料策略的出現,下一節將說明如何管理整個目錄,或使用主資料深入進行特定資料管理。

步驟 5:主資料管理

MDM) (主資料管理是符合最重要的資料實體的實務,這些資料實體必須準確、唯一且一致地應用於業務的所有領域,因為此資料中的錯誤和問題可能會影響整個業務。 透過我們的其中一個 MDM 合作夥伴,您可以將您選擇的 MDM 解決方案與 Microsoft Purview 整合,以啟用資料統一、標準化和清理,以啟用黃金記錄建立和將主資料發佈為資料產品。

請遵循這裡的教學課程,以取得您選擇的解決方案: Microsoft Purview 中的主要資料管理

步驟 6:管理資料健康情況

在整合式目錄的健康管理區域中,中央資料辦公室和其他資料管理員可以根據其公司標準評估資料狀態,並有效管理其策略的進度。 為了確保公司中的每個人都知道他們可以做些什麼來增加數據的價值,必須理解這些標準並可擴展到整個組織,而無需讓每個人都成為數據治理專家。 從一組開箱即用的行業標準控制項開始,每個數據辦公室都可以自定義控件以滿足他們的期望並確保它符合他們的數據目標。 這些控制措施的有效性的關鍵不僅在於衡量這些標準,還在於確保資料負責人能夠自行採取行動,並負責進行影響資料價值的改進。 在 Data Estate Health 中,您可以設定和管理所有這些重要功能。

必要條件

使用資料資產健康情況評估您的資料控管

  1. 開啟 Microsoft Purview 入口網站

  2. 選取 [整合式目錄]。

  3. 在左側導覽中的 [資料資產健康情況] 底下,選取 [健康情況控制項]。

  4. 選取 [值建立] 控制組旁邊的胡蘿蔔>

  5. 將滑鼠停留在控制項標題上時,選取鉛筆圖示以編輯控制項。 藉由編輯控制項,您可以變更控制項的臨界值,以設定分數的預期值,並設定色彩評分以示範進度階段。

  6. 詳細資料可讓您提供控制項的描述及其對組織的意義,並設定特定控制項的擁有者。

  7. 選取控制項的 [規則] 索引標籤以變更臨界值。 此設定的目標很高,如果它不健康,則跟進至關重要。

    1. 繼承自群組:切換以關閉 (應變為灰色) 。
    2. 目標分數:90
    3. 選取 [新增規則]。
    4. 將分數旁邊的方塊設定為 GreaterThanOrEqual
    5. 將百分比設定為 90
    6. 狀態 = 健康 (綠色)
    7. 否則方塊狀態 = 嚴重 (紫色)
    8. 選取 [儲存]
  8. 在資料資產健康情況下,選取 [ 中繼資料品質]。

您可以在此處變更或新增建立控制項分數的規則。 在這裡,您想要變更 「價值建立」 動作的嚴重性,以確保所有使用者都知道此動作的重要性。

  1. 選取 [設定嚴重性]
  2. 選取 [值建立 ] 控制群組
  3. 選取 商務 OKR 對齊 控制項標題
  4. 將嚴重性從中變更為高,然後選取 儲存
  5. 選取 健康情況動作 索引標籤
  6. 篩選器指派給:到您的名稱
  7. 選取動作,您可以在其中查看動作擁有者需要執行哪些動作,以確保符合治理預期,或者他們可以指派新的擁有者,以取得最佳專家來提供其輸入。 還有一個狀態,可以讓其他人知道哪些工作正在進行,以及哪些其他操作可能需要優先考慮。

第 7 步:數據民主化

資料民主化使用戶能夠以合規的方式尋找和存取他們需要的資料。 它確保人們能夠找到建立商業價值所需的數據。 整合式目錄提供乾淨且輕鬆的探索資料體驗。 它使管理員能夠大規模更新和管理目錄中可用的數據。 在本節中,您將瞭解使用者如何尋找和要求存取資料,並確保適當的核准者可以追蹤並提供這些存取要求的輸入。

必要條件

探索資料產品

  1. 在整合式目錄中,選取 [探索],然後選取 [資料產品]。
  2. [資料產品 ] 頁面上,使用搜尋列依年齡搜尋疫苗接種率。
  3. 在這裡,您會看到您在 第 2 節中發佈的資料產品。 此檢視顯示使用者如何只看到針對他們的資料,並防止使用者必須瀏覽高度技術性的資料資產。
  4. 選擇 Covid-19 疫苗接種和按年齡劃分的病例趨勢 數據產品
    1. 在這裡,取用者可以看到您提供的中繼資料,以及您在設定期間設定的任何其他屬性。 數據質量分數也在這裡,因此消費者在訪問數據之前就知道質量。
    2. 選取資產,取用者可以看到資料資產中可用的所有直欄。
    3. 選取 Outbreak 詞彙表術語,取用者可以看到有關該術語的描述和其他資訊,以更深入地瞭解資料。
  5. 一旦消費者確信他們想要使用該資料,他們就需要獲得對資料的核准存取權。
    1. 選取 [要求存取權]
    2. 填寫表單詳細信息以提交請求。
    3. 用戶:留下你的名字
    4. 管理員核准:自動需要並導向至 Microsoft Entra ID 管理員。
    5. 目的:選擇目的
    6. 業務理由:OKR 監控
    7. 核取證明旁邊的方塊,表示您瞭解使用此資料的預期。
    8. 選取 [傳送]。

存取要求現在會傳送至 Microsoft Entra ID 中列出的管理員。 從這裡,管理員可以開啟電子郵件並選取連結,或進入 Microsoft Purview 來存取要求。 核准和管理存取權可以直接在 Microsoft Purview 中完成。

  1. 在整合式目錄中,選取目錄管理,然後選取要求。
  2. 選取 Personal Health 網域。
  3. 選取您提交的要求。
  4. 現在,核准者可以透過選取 回應 來 核准或拒絕請求。