이 작업에서는 하나의 규칙이 포함된 일치 정책을 작성합니다. 규칙에는 하나의 필수 구성 요소인 공급자 ID가 있습니다. 즉, 규칙의 다른 도메인을 사용하기 전에 공급업체 ID가 일치해야 합니다. 이 규칙은 유사성 값이 70%설정된 공급자 이름과유사성 값이30% 설정된 연락처 전자 메일의 두 가지 다른 도메인을 사용합니다.
DQS 클라이언트의 기본 페이지에서 Suppliers 기술 자료 옆의 오른쪽 화살표를 클릭하고 일치 정책을 선택합니다.
지도 페이지에서 데이터 원본용 Excel 파일을 선택합니다.
찾아보기를 클릭하고 필터가 Excel 통합 문서로 설정되어 있는지 확인하고 정리 작업을 수행한 후 내보낸 정리된 공급자 List.xls 파일을 선택합니다.
비고
이 작업이 끝나면 이 작업은 주로 일치 정책을 정의하는 데 중점을 두므로 결과를 내보낼 수 없습니다. 일치 작업에 대한 데이터 품질 프로젝트를 만들고 실행하여 다음 단원에서 이 일치 정책을 사용하여 공급자 목록에서 중복 항목을 제거합니다.
SupplierID 열을 Supplier ID 도메인에 매핑하고, 공급자 이름 열을 Supplier Name 도메인에 매핑하고, ContactEmailAddress 열을 연락처 전자 메일 도메인에 매핑합니다. 일치하는 정책을 정의하는 데 사용하려는 도메인에 원본 열을 매핑하기만 하면 됩니다. 이 경우 공급업체 ID, 공급업체 이름 및 연락처 전자 메일 도메인을 일치하는 정책 활동에 사용할 수 있도록 합니다.
다음을 클릭하여 일치 정책 페이지로 이동하여 일치하는 정책을 하나의 규칙으로 정의합니다.
도구 모음 에서 일치하는 규칙 만들기 단추를 클릭하여 정책에서 규칙을 만듭니다.
오른쪽의 규칙 세부 정보 창에서 규칙 이름에 대해 중복 공급자 제거를 입력합니다.
오른쪽 창의 도구 모음에서 새 도메인 요소 추가 를 클릭합니다.
도메인에 대한 공급업체 ID를 선택하고 필수 구성 요소 확인란을 선택합니다. 유사성은 자동으로 Exact로 설정됩니다. 공급업체 ID를 필수 구성 요소로 설정하면 두 레코드에서 이 필드의 값이 100% 일치 항목을 반환해야 하며, 그렇지 않으면 레코드가 일치 항목으로 간주되지 않고 규칙의 다른 절이 무시되도록 지정합니다.
도구 모음 에서 새 도메인 요소 추가 를 다시 클릭합니다.
공급업체 이름 도메인을 선택하고 유사성에 유사를 선택하며 가중치에 70을 입력합니다. 여기서는 공급자 이름이 동일할 필요는 없지만 레코드가 일치 항목으로 간주될 때 비슷할 수 있도록 지정합니다. 가중치는 이 필드의 점수가 전체 일치 점수에 기여했음을 나타냅니다.
이전 두 단계를 반복하여 연락처 전자 메일 도메인을 추가하고, 가중치에 대해 30을 설정합니다.
최소 일치 점수는 DQS 관리구성 페이지의 일반 탭에 표시되는 값인 %80으로 설정됩니다. 여기서는 이 임계값 이상으로만 이 점수를 늘릴 수 있습니다.
겹치는 클러스터 옵션이 선택되어 있습니다. 이 옵션을 사용하면 레코드가 여러 클러스터에 표시할 수 있습니다. 설정을 겹치지 않는 클러스터로 변경하면 공통 레코드가 있는 클러스터가 단일 클러스터로 결합됩니다.
이 페이지의 시작 단추를 사용하면 정책의 각 규칙을 개별적으로 테스트할 수 있는 반면, 다음 페이지의 시작 단추를 사용하면 전체 정책(정책의 모든 규칙)을 테스트할 수 있습니다.
[다음]을 클릭하여 일치 결과 페이지로 전환합니다.