다음을 통해 공유


데이터 품질 개선 작업

데이터 품질은 의사 결정의 품질에 직접적인 영향을 줍니다. 양질의 데이터는 비즈니스 프로세스 인사이트, 고객에 대한 더 나은 이해, 더 빠른 문제 식별을 제공합니다. 데이터 품질 작업은 데이터 자산의 데이터 품질을 개선하기 위해 해결해야 하는 문제를 식별합니다.

필수 역할

데이터 품질 작업 유형

생성된 데이터 품질 작업의 형식은 다음과 같습니다.

  • 기본 임계값 아래로 떨어지는 규칙입니다.
  • 임계값 아래로 떨어지는 글로벌 데이터 품질 점수입니다.
  • 실패한 데이터 품질 검사 및 데이터 품질 프로파일링 작업입니다.
  • 마지막 실행 이후 데이터가 변경되지 않아 건너뛰는 데이터 품질 검사 및 데이터 품질 프로파일링 작업입니다.
  • 프로파일된 열의 이상값 존재
  • 프로파일된 데이터 자산에 null이 너무 많습니다.

데이터 품질 작업 심각도

데이터 품질 작업에는 데이터 품질 점수에 따라 심각도 수준 및 색 표시기가 있습니다.

  • 높음(빨간색): 데이터 품질 점수가 25보다 작습니다.
  • 중간(주황색): 데이터 품질 점수가 50보다 작습니다.
  • 낮음(노란색): 데이터 품질 점수가 75보다 작습니다.

거버넌스 도메인에 대한 데이터 품질 작업 보기 및 관리

데이터 품질 작업은 데이터 자산 수준에서 거버넌스 도메인 수준으로 롤업됩니다. 작업을 찾아보고 추가 작업을 위해 사용자에게 할당하려면 다음을 수행합니다.

  1. Microsoft Purview 통합 카탈로그 상태 관리를 선택한 다음, 데이터 품질을 선택합니다.

  2. 목록에서 거버넌스 도메인을 선택합니다.

  3. 작업 항목 단추에는 도메인에 대한 작업 항목 수가 표시됩니다. 작업 항목을 선택하여 모든 데이터 품질 작업을 봅니다.

  4. 작업 목록에서 작업을 선택하여 작업의 세부 정보 페이지를 봅니다.

  5. 여기에서 사용자에게 작업을 할당하여 조사하고 resolve 수 있습니다. 권장 사항 섹션에서는 수행할 작업을 제안하고 낮은 품질의 데이터를 찾기 위한 쿼리를 제공합니다.

    참고

    • 모든 작업이 데이터와 관련되거나 데이터 품질 규칙과 관련이 있는 것은 아니므로 모든 작업에 SQL 쿼리가 있는 것은 아닙니다. 일부 작업은 실패하거나 건너뛴 데이터 품질 작업과 같은 시스템 관련 작업입니다.
    • 사용자 지정 규칙 예외가 발생하는 경우 즉, 사용자 지정 규칙에서 생성된 데이터 품질 점수가 정의된 임계값을 충족하지 않으면 작업이 생성됩니다. 그러나 SQL 쿼리는 제안되지 않습니다.

    데이터 품질 작업 세부 정보의 스크린샷

  6. 상태*를 업데이트한 다음 저장을 선택합니다.

데이터 자산에 대한 데이터 품질 작업 보기 및 관리

데이터 자산에 대한 데이터 품질 작업을 찾아보고 데이터 품질 개요 페이지에서 사용자에게 할당할 수 있습니다.

  1. Microsoft Purview 통합 카탈로그 상태 관리 메뉴 및 데이터 품질 하위 메뉴를 선택합니다.

  2. 목록에서 거버넌스 도메인을 선택합니다.

  3. 목록에서 데이터 제품을 선택한 다음 자산 목록에서 데이터 자산을 선택합니다.

  4. 데이터 자산의 세부 정보 페이지에서 작업 타일에서 모두 보기를 선택하여 데이터 자산에 대한 모든 작업을 확인합니다.

  5. 활성, 진행 중, 해결됨내 항목 작업 목록을 탐색합니다.

    선택한 자산에 대한 데이터 품질 작업의 스크린샷.

  6. 작업을 선택하여 세부 정보를 확인하고 사용자에게 할당하여 조사하고 resolve. 구제를 위한 개인. 권장 사항 섹션에서는 수행할 작업을 제안하고 낮은 품질의 데이터를 찾기 위한 쿼리를 제공합니다.

    참고

    • 모든 작업이 데이터와 관련되거나 데이터 품질 규칙과 관련이 있는 것은 아니므로 모든 작업에 SQL 쿼리가 있는 것은 아닙니다. 일부 작업은 실패하거나 건너뛴 데이터 품질 작업과 같은 시스템 관련 작업입니다.
    • 사용자 지정 규칙 예외가 발생하는 경우 즉, 사용자 지정 규칙에서 생성된 데이터 품질 점수가 정의된 임계값을 충족하지 않으면 작업이 생성됩니다. 그러나 SQL 쿼리는 제안되지 않습니다.

    자산 수준 작업 세부 정보의 스크린샷

  7. 상태를 업데이트한 다음 저장을 선택합니다.

리소스