このタスクでは、照合アクティビティ用のデータ品質プロジェクトを作成し、クレンジングされたサプライヤー データに対して照合プロセスを実行して、データ内の重複を削除します。
DQS クライアントのメイン ページで、[新しいデータ品質プロジェクト] をクリックします。
「プロジェクトの名前」から「サプライヤー重複の削除」と入力します。
ナレッジ ベースの使用フィールドの KB 一覧からサプライヤーを選択します。 前のレッスンで、このナレッジ ベースで照合ポリシーを作成しました。
右下ペインからアクティビティの一覧から [照合] を選択します。
[次へ] をクリックします。
[マップ] ページで、[データ ソースの Excel ファイル] を選択します。
[ 参照 ] をクリックし、[ クレンジングされたサプライヤー List.xls] を選択します。これはクレンジング アクティビティからの出力ファイルです。
SupplierID ソース列を仕入先 ID ドメインにマップし、仕入先名列を仕入先名ドメインにマップし、ContactEmailAddress 列を連絡先メール ドメインにマップします。
[ 次へ ] をクリックして、[ 照合 ] ページに切り替えます。
開始をクリックして、マッチングプロセスを開始します。 一致するポリシーを定義するために同じ入力ファイルを使用したため、前のタスクと同様の結果が表示されます。
リスト ボックスで、一致したすべてのレコードとその一致するスコアを確認します。 結果は、前のタスクで確認した結果と同じである必要があります。 この照合アクティビティの結果を分析するには、前のタスクの手順を参照してください。
[ 次へ ] をクリックして 、[エクスポート ] ページに切り替えます。