共用方式為


第 2 課:使用供應商知識庫清理供應商數據

在這一課,您會使用您在第一課建立的供應商知識庫,來清理 Excel 檔案中的 供應商 數據。 DQS 中的數據清理包含 計算機輔助程式 ,可分析數據如何符合知識庫中知識,以及可讓您檢閱和修改計算機輔助程式結果的 互動式程式 。 數據清理功能會識別數據源中不正確的數據,然後更正或建議不正確數據的更正。 它也會使用定義域值、同義字的前置值、定義域規則、以詞彙為基礎的關聯性,以及參考數據,來標準化和擴充客戶數據。 您可以透過互動方式核准或拒絕電腦輔助程式提議的變更。 如需詳細資訊 ,請參閱數據清理

計算機輔助程式會使用下列閾值,您可以在 DQS 用戶端主頁面上使用 [組態] 選項進行設定。

  • 建議的最小分數: DQS 用來建議取代值的最小分數或信賴等級。

  • 自動更正的最小分數: DQS 用來自動更正值的最低分數或信賴等級。

如需如何設定這些設定的詳細資訊 ,請參閱設定清理和比對的臨界值

在本課程中,您會執行下列工作,以使用供貨商知識庫清除輸入數據。

  1. 建立用於清理的數據品質項目、選取 [供貨商知識庫] 作為知識庫,以用來分析及清理 Excel 檔案中的源數據,然後選取 [清理] 活動。

  2. 將您要清理的 Excel 資料行對應至知識庫中適當的 DQS 定義域/複合定義域。

  3. 執行電腦輔助的清理活動。 計算機輔助程式會在 Data Quality Client 中顯示資料質量資訊,讓您可用來以互動方式清理數據。

  4. 檢視和管理清理活動的結果。 您可以檢閱由電腦輔助流程發現的值,包括正確的、不正確但已更正的、不正確且有建議修改的,或是無效的。 您可以使用 [更正至] 欄位以互動方式批核或否決變更,並更正或覆蓋電腦輔助程序的建議。

  5. 將清理程序的結果匯出至 Excel 檔案。

  6. 將清理專案中的值匯入定義域,以使用新的規則、值、更正等來增強知識庫中的知識...

後續步驟

工作 1:建立數據質量專案