이 단원에서는 공급자 데이터에 대한 지식(메타데이터)을 사용하여 Suppliers 라는 DQS 기술 자료를 만듭니다. 기술 자료를 사용하여 입력 공급자 데이터에 대한 정리 및 일치 작업을 수행합니다. 정리 작업은 잘못되거나 잘못된 데이터를 식별하고, 잘못된 데이터를 수정하고, 수정/제안을 제안하고, 데이터를 표준화하고, 추가 정보를 사용하여 데이터를 보강합니다. 일치하는 활동은 데이터를 비교하고 데이터에서 중복 항목을 제거하는 데 도움이 되는 데이터에서 유사한 레코드(약간 다른)를 식별합니다.
대화형 프로세스와 컴퓨터 지원 프로세스를 모두 사용하여 기술 자료를 만들고, 빌드하고, 관리할 수 있습니다. 지식 베이스의 지식은 데이터 정리 및/또는 일치하려는 각 데이터 필드에 관련된 개별 도메인에서 관리됩니다.
이 단원에서는 다음 작업을 수행하여 Suppliers 기술 자료를 만듭니다.
Suppliers라는 DQS 기술 자료를 만듭니다. 여러 가지 방법으로 기술 자료를 만들 수 있습니다. 기술 자료를 처음부터 빌드하거나 기존 기술 자료를 기반으로 빌드하거나 미리 빌드되고 내보낸 기술 자료가 포함된 DQS 파일(.dqs)을 가져오거나 샘플 데이터에 대한 기술 자료 검색 작업을 수행하여 빌드할 수 있습니다. 이 자습서에서는 기술 자료를 처음부터 만듭니다.
공급자 기술 자료에 데이터를 정리하고 데이터를 일치시켜 중복 항목을 식별하는 데 사용하는 도메인을 만듭니다. 데이터의 모든 데이터 필드가 아닌 정리 및 일치 작업에 사용하려는 데이터 필드에 대한 도메인을 만듭니다.
값을 수동으로 추가하고, Excel 파일에서 값을 가져오고, 샘플 데이터에 대한 지식 검색 작업을 수행하고, 정리 프로젝트에서 프로젝트 값을 가져와서 도메인에 값을 추가합니다. 또한 자습서에서 수행하지 않는 도메인 속성 및 값이 포함된 DQS 파일을 가져와서 도메인 값을 가져올 수도 있습니다.
도메인에 대한 규칙을 설정합니다. 도메인 규칙은 DQS에서 도메인 값의 유효성을 검사하고, 수정하고, 표준화하는 데 사용하는 조건입니다.
도메인에 대한 용어 기반 관계를 설정합니다. 용어 기반 관계를 사용하면 도메인의 값에 포함된 용어를 수정할 수 있습니다. 예를 들어 Contoso Inc.의 값에서 Inc. 는 Incorporated로 정의할 수 있는 용어입니다. 이렇게 하면 중복 항목을 식별할 뿐만 아니라 데이터를 표준화하는 데 도움이 됩니다. 예를 들어 Contoso Inc. 및 Contoso Incorporated는 중복된 것으로 간주될 수 있습니다.
도메인 값에서 동의어를 지정합니다. 둘 이상의 값을 동의어로 설정하고 그 중 하나를 선행 값으로 설정하여 정리 작업 중에 동의어 값을 대체하여 데이터를 표준화할 수 있습니다.
주소 줄, 도시, 주 및 Zip 도메인으로 구성된 주소 유효성 검사라는 복합 도메인을 만듭니다. 복합 도메인은 하나 이상의 단일 도메인으로 구성된 도메인입니다. 이를 통해 여러 도메인을 포함하는 규칙을 만들 수 있습니다. 예를 들어 규칙을 정의할 수 있습니다. City가 로스앤젤레스인 경우 시/도는 CA여야 합니다. 여기서 City와 State는 별도의 두 도메인입니다.
참조 데이터 서비스를 구성하고 사용합니다. DQS(Data Quality Services)의 참조 데이터 서비스 기능을 사용하면 타사 참조 데이터 공급자를 구독하고 고품질 데이터에 대해 유효성을 검사하여 비즈니스 데이터를 정리하고 보강할 수 있습니다. 정리 프로세스 중에 DQS 내에서 주요 DQS 공급자의 서비스를 사용하여 데이터를 표준화, 수정 또는 보강할 수 있습니다. 이 자습서에서는 Azure Marketplace에서 참조 데이터 서비스를 사용하고 주소 유효성 검사 복합 도메인과 연결된 서비스를 사용하여 주소 데이터를 정리하도록 DQS 환경을 구성하는 방법에 대해 알아봅니다.
기술 자료를 정리 및 일치 작업에 사용할 수 있도록 기술 자료를 게시합니다.