다음을 통해 공유


작업 2: 일치 정책 테스트 및 게시

이 작업에서는 중복 공급자 제거 일치 정책을 테스트하고 게시합니다.

  1. 일치 결과 페이지에서 시작을 클릭하여 전체 정책을 테스트합니다. 이 경우 정책에 규칙만 있으므로 규칙 및 정책 테스트의 결과는 동일해야 합니다.

  2. 목록 상자에서 일치하는 모든 레코드와 일치하는 점수를 검토합니다. 녹색 아이콘이 연결된 레코드는 앞에 있는 피벗 레코드의 중복 레코드입니다. 다음은 몇 가지 예입니다.

    1. Record ID: 1000005 레코드는 Record Id: 1000004 레코드와 점수: 100%로 일치합니다. 두 레코드 모두 SupplierID(필수 구성 요소), Supplier Name, 및 ContactEmailAddress 열에 대해 동일한 값을 가지고 있기 때문입니다. DQS는 임의로 레코드를 클러스터의 피벗 레코드로 선택합니다.

    2. 기록 1000023은 93%의 일치 점수로 기록 1000022과 일치합니다. 이는 두 기록이 SupplierID (필수 구성 요소)Supplier Name 열에서 동일한 값을 가지지만, ContactEmailAddress 열에서는 다른 값을 갖기 때문입니다.

    3. 목록 아래쪽으로 스크롤하여 레코드 ID가 있는 레코드 두 개(10000511000052)를 확인합니다. 두 레코드는 SupplierIDContactEmailAddress 열에 대해 동일한 값을 가지지만 Supplier Name 열의 값은 다르므로 레코드 1000052 일치 점수가 91 %일치하는 것으로 간주됩니다.

    정책 정의 - 정책 결과

  3. 일치하는 레코드(녹색 아이콘 포함)를 마우스 오른쪽 단추로 클릭하고 세부 정보 보기를 클릭하여 전체 일치 점수에 대한 각 필드 점수의 기여도와 같은 일치 항목에 대한 자세한 내용을 확인합니다.

    일치 점수 세부 정보 대화 상자

  4. 기를 클릭하여 일치 점수 세부 정보 대화 상자를 닫습니다.

  5. 페이지 아래쪽의 일치 결과 탭을 클릭합니다. 이 탭에서는 일치하는 레코드 수, 일치하지 않는 레코드 수, 일치하는 레코드가 있는 클러스터 수, 평균 클러스터 크기, 최소 클러스터 크기 및 최대 클러스터 크기와 같은 세부 정보를 제공합니다. 자세한 내용은 일치 정책 만들기 를 참조하세요. 이 작업의 결과를 내보낼 수 없습니다. 샘플 데이터를 사용하여 샘플 데이터에 대한 규칙 및 정책을 테스트하여 일치하는 정책을 정의하기만 하면 됩니다.

    일치 결과 탭

  6. 마침을 클릭하여 일치하는 정책 만들기를 완료합니다.

    비고

    여기에서 일치하는 정책을 정의했습니다. 따라서 결과를 출력 파일로 내보낼 수 없습니다. 기본적으로 샘플 입력 파일을 사용하고, 규칙을 만들고, 정책을 정의하기 위해 샘플 데이터에 대한 규칙 및 정책을 테스트했습니다.

  7. SQL Server Data Quality Services 대화 상자에서 게시 를 클릭하고 메시지 상자에서 확인을 클릭합니다. 이제 정의한 일치 정책이 Suppliers 기술 자료에 게시됩니다. 기술 자료를 사용하여 입력 파일에 대해 일치 프로세스를 실행하여 중복 항목을 식별하고 제거할 수 있습니다.

다음 단계

작업 3: 일치를 위한 데이터 품질 프로젝트 만들기 및 실행