다음을 통해 공유


1단원: 공급업체 DQS 기술 자료 만들기

이 단원에서는 공급자 데이터에 대한 지식(메타데이터)을 사용하여 Suppliers 라는 DQS 기술 자료를 만듭니다. 기술 자료를 사용하여 입력 공급자 데이터에 대한 정리 및 일치 작업을 수행합니다. 정리 작업은 잘못되거나 잘못된 데이터를 식별하고, 잘못된 데이터를 수정하고, 수정/제안을 제안하고, 데이터를 표준화하고, 추가 정보를 사용하여 데이터를 보강합니다. 일치하는 활동은 데이터를 비교하고 데이터에서 중복 항목을 제거하는 데 도움이 되는 데이터에서 유사한 레코드(약간 다른)를 식별합니다.

대화형 프로세스와 컴퓨터 지원 프로세스를 모두 사용하여 기술 자료를 만들고, 빌드하고, 관리할 수 있습니다. 지식 베이스의 지식은 데이터 정리 및/또는 일치하려는 각 데이터 필드에 관련된 개별 도메인에서 관리됩니다.

이 단원에서는 다음 작업을 수행하여 Suppliers 기술 자료를 만듭니다.

  • Suppliers라는 DQS 기술 자료를 만듭니다. 여러 가지 방법으로 기술 자료를 만들 수 있습니다. 기술 자료를 처음부터 빌드하거나 기존 기술 자료를 기반으로 빌드하거나 미리 빌드되고 내보낸 기술 자료가 포함된 DQS 파일(.dqs)을 가져오거나 샘플 데이터에 대한 기술 자료 검색 작업을 수행하여 빌드할 수 있습니다. 이 자습서에서는 기술 자료를 처음부터 만듭니다.

  • 공급자 기술 자료에 데이터를 정리하고 데이터를 일치시켜 중복 항목을 식별하는 데 사용하는 도메인을 만듭니다. 데이터의 모든 데이터 필드가 아닌 정리 및 일치 작업에 사용하려는 데이터 필드에 대한 도메인을 만듭니다.

  • 값을 수동으로 추가하고, Excel 파일에서 값을 가져오고, 샘플 데이터에 대한 지식 검색 작업을 수행하고, 정리 프로젝트에서 프로젝트 값을 가져와서 도메인에 값을 추가합니다. 또한 자습서에서 수행하지 않는 도메인 속성 및 값이 포함된 DQS 파일을 가져와서 도메인 값을 가져올 수도 있습니다.

  • 도메인에 대한 규칙을 설정합니다. 도메인 규칙은 DQS에서 도메인 값의 유효성을 검사하고, 수정하고, 표준화하는 데 사용하는 조건입니다.

  • 도메인에 대한 용어 기반 관계를 설정합니다. 용어 기반 관계를 사용하면 도메인의 값에 포함된 용어를 수정할 수 있습니다. 예를 들어 Contoso Inc.의 값에서 Inc. 는 Incorporated로 정의할 수 있는 용어입니다. 이렇게 하면 중복 항목을 식별할 뿐만 아니라 데이터를 표준화하는 데 도움이 됩니다. 예를 들어 Contoso Inc.Contoso Incorporated는 중복된 것으로 간주될 수 있습니다.

  • 도메인 값에서 동의어를 지정합니다. 둘 이상의 값을 동의어로 설정하고 그 중 하나를 선행 값으로 설정하여 정리 작업 중에 동의어 값을 대체하여 데이터를 표준화할 수 있습니다.

  • 주소 줄, 도시, 주 및 Zip 도메인으로 구성된 주소 유효성 검사라는 복합 도메인을 만듭니다. 복합 도메인은 하나 이상의 단일 도메인으로 구성된 도메인입니다. 이를 통해 여러 도메인을 포함하는 규칙을 만들 수 있습니다. 예를 들어 규칙을 정의할 수 있습니다. City가 로스앤젤레스인 경우 시/도는 CA여야 합니다. 여기서 City와 State는 별도의 두 도메인입니다.

  • 참조 데이터 서비스를 구성하고 사용합니다. DQS(Data Quality Services)의 참조 데이터 서비스 기능을 사용하면 타사 참조 데이터 공급자를 구독하고 고품질 데이터에 대해 유효성을 검사하여 비즈니스 데이터를 정리하고 보강할 수 있습니다. 정리 프로세스 중에 DQS 내에서 주요 DQS 공급자의 서비스를 사용하여 데이터를 표준화, 수정 또는 보강할 수 있습니다. 이 자습서에서는 Azure Marketplace에서 참조 데이터 서비스를 사용하고 주소 유효성 검사 복합 도메인과 연결된 서비스를 사용하여 주소 데이터를 정리하도록 DQS 환경을 구성하는 방법에 대해 알아봅니다.

  • 기술 자료를 정리 및 일치 작업에 사용할 수 있도록 기술 자료를 게시합니다.

다음 단계

작업 1: 기술 자료 및 도메인 만들기