다음을 통해 공유


3단원: 공급자 목록에서 중복 항목을 제거하기 위한 데이터 일치

기술 자료에서 일치 정책을 만들어 일치 작업을 수행하기 위한 기술 자료를 준비합니다. 기술 자료에는 일치하는 정책이 하나만 있을 수 있습니다. 일치 정책은 하나 이상의 일치 규칙으로 구성됩니다. 규칙은 일치 프로세스에 관련된 도메인을 식별하고 각 도메인 값이 일치하는 판단에 전달하는 가중치를 지정합니다. 규칙에서 도메인 값이 정확히 일치해야 하는지 또는 유사할 수 있는지 여부와 유사성을 지정합니다. 또한 도메인 일치가 일치 프로세스의 필수 구성 요소인지 여부를 지정합니다. 각 규칙을 개별적으로 테스트하고 샘플 데이터에 대해 전체 정책을 테스트할 수 있습니다. 테스트 프로세스는 일치하는 점수가 클러스터(그룹)의 DQS 구성에 지정된 최소 레코드 점수 임계값보다 큰 레코드를 표시합니다. 만족할 때까지 정책의 규칙을 계속 조정할 수 있습니다.

정책을 정의한 후 데이터 품질 프로젝트를 만들어 일치하는 작업을 실행합니다. 일치하는 프로젝트는 평가할 데이터 원본에 일치 정책의 일치 규칙을 적용합니다. 이 프로세스는 두 행이 일치할 가능성을 평가합니다. DQS는 일치 분석을 수행할 때 DQS에서 일치 항목으로 간주하는 레코드 클러스터를 만듭니다. DQS는 레코드 중 하나를 피벗 레코드로 임의로 식별합니다. 클러스터에 대한 적절한 일치 항목이 아닌 레코드를 확인하고 거부할 수 있습니다. 자세한 내용은 일치 정책 만들기 항목을 참조하세요.

이 단원에서는 일치하는 작업을 수행하여 공급자 목록에서 중복 항목을 제거합니다. 먼저 공급업체 목록에서 중복 항목을 식별하고 기술 자료에 정책을 게시하는 하나의 규칙으로 일치하는 정책을 만듭니다. 다음으로, 일치를 위해 데이터 품질 프로젝트를 만들고 실행합니다. 마지막으로, 일치 작업의 결과를 나중에 MDS(Master Data Services)에 데이터를 업로드하는 데 사용하는 Excel 파일로 내보냅니다.

다음 단계

작업 1: 일치 정책 정의