次の方法で共有


レッスン 3: データを照合して仕入先一覧から重複を削除する

ナレッジ ベースで照合ポリシーを作成して、照合アクティビティを実行するためのナレッジ ベースを準備します。 ナレッジ ベースに一致するポリシーは 1 つだけ存在できます。 照合ポリシーは、1 つ以上の照合ルールで構成されます。 ルールは、照合プロセスに関係するドメインを識別し、各ドメイン値が照合判定で持つ重みを指定します。 ルールでは、ドメイン値が完全に一致する必要があるか、類似しているか、および類似度を指定します。 また、ドメインの一致が一致プロセスの前提条件であるかどうかを指定します。 各ルールを個別にテストし、サンプル データに対してポリシー全体をテストできます。 テスト プロセスでは、クラスター (グループ) の DQS 構成で指定された 最小レコード スコア しきい値よりも一致するスコアが大きいレコードが表示されます。 問題が解決するまで、引き続きポリシーのルールを調整できます。

ポリシーを定義した後、照合アクティビティを実行するデータ品質プロジェクトを作成します。 照合プロジェクトは、照合ポリシーの照合ルールを評価するデータ ソースに適用します。 このプロセスでは、2 つの行が一致する可能性を評価します。 DQS は、照合分析を実行すると、DQS が一致と見なすレコードのクラスターを作成します。 DQS は、いずれかのレコードをピボット レコードとしてランダムに識別します。 クラスターに対して適切な一致ではないレコードを確認および拒否できます。 詳細については、「 照合ポリシーの作成」 トピックを参照してください。

このレッスンでは、照合アクティビティを実行して、仕入先一覧から重複を削除します。 まず、一致するポリシーを 1 つのルールで作成し、サプライヤー リスト内の重複を特定し、ナレッジ ベースにポリシーを発行します。 次に、照合用のデータ品質プロジェクトを作成して実行します。 最後に、照合アクティビティの結果を Excel ファイルにエクスポートします。このファイルは、後でマスター データ サービス (MDS) にデータをアップロードするときに使用します。

次の手順

タスク 1: 照合ポリシーの定義