다음을 통해 공유


Microsoft Purview 데이터 맵 대한 가격 책정

이 가이드에서는 클래식 Microsoft Purview 거버넌스 포털의 Microsoft Purview 데이터 맵 대한 가격 책정 지침을 설명합니다.

Microsoft Purview(이전의 Azure Purview)에 대한 전체 가격 책정 지침 세부 정보는 가격 책정 지침 개요를 참조하세요.

특정 가격 정보는 Microsoft Purview(이전의 Azure Purview) 가격 책정 페이지를 참조하세요. 이 문서에서는 데이터 맵의 가격 책정에 영향을 주는 기능 및 요소를 안내합니다.

데이터 맵의 가격 책정에 영향을 미치는 직접 비용은 다음 세 가지 차원을 기반으로 합니다.

탄력적 데이터 맵

  • 데이터 맵은 Microsoft Purview 거버넌스 포털 아키텍처의 기초이므로 지정된 시점에서 데이터 자산의 자산 정보를 최신 상태로 유지해야 합니다.

  • 데이터 맵은 CU( 용량 단위 )로 청구됩니다. 카탈로그가 최대 10GB의 메타데이터 스토리지를 저장하고 최대 25개의 데이터 맵 작업/초를 제공하는 경우 데이터 맵은 하나의 CU에서 프로비전됩니다.

  • 데이터 맵은 계정을 처음 만들 때 항상 하나의 CU에서 프로비전됩니다.

  • 그러나 데이터 맵은 작업 처리량메타데이터 스토리지라는 두 가지 주요 요소와 관련하여 데이터 맵의 변경 내용을 수용하기 위해 해당 탄력성 창의 최소 제한과 최대 제한 사이에서 자동으로 확장됩니다.

작업 처리량

  • 데이터 맵에서 수행되는 만들기, 읽기, 업데이트, 삭제 작업을 기반으로 하는 이벤트 기반 요소
  • 데이터 맵 작업의 몇 가지 예는 다음과 같습니다.
    • 데이터 맵에서 자산 만들기
    • 소유자, 관리자, 부모, 계보와 같은 자산에 관계 추가
    • 설명, 용어집 용어와 같은 비즈니스 메타데이터를 추가하도록 자산 편집
    • 검색 결과 페이지에 대한 키워드 검색 반환 결과
    • API를 사용하여 정보 가져오기 또는 내보내기
  • 데이터 맵에서 여러 쿼리가 실행되는 경우 I/O 작업 수도 증가하여 데이터 맵이 확장됩니다.
  • 또한 동시 사용자 수는 데이터 맵 용량 단위를 제어하는 요인을 형성합니다.
  • 고려해야 할 다른 요인은 검색 쿼리 유형, API 상호 작용, 워크플로, 승인 등입니다.
  • 데이터 버스트 수준
    • 더 많은 작업/초 처리량이 필요한 경우 데이터 맵은 탄력적 창 내에서 자동 크기 조정하여 변경된 부하를 충족할 수 있습니다.
    • 이는 예측하고 계획해야 하는 버스트 특성을 구성합니다.
    • 버스트 특성은 버스트가 존재하는 버스트 수준버스트 지속 시간 으로 구성됩니다.
      • 버스트 수준은 안정적인 상태에서 예상되는 일관된 탄력성의 곱하기 인덱스입니다.
      • 버스트 기간은 메타데이터 증가 또는 데이터 맵의 작업 수 증가로 인해 이러한 버스트(탄력적)가 예상되는 월의 백분율입니다.

메타데이터 스토리지

  • 자산 수가 데이터 자산에서 감소하고 후속 증분 검사를 통해 데이터 맵에서 제거되면 스토리지 구성 요소가 자동으로 감소하여 데이터 맵이 축소됩니다.

자동화된 검사, 분류 및 수집

Microsoft Purview 데이터 맵 메타데이터 수집을 트리거할 수 있는 두 가지 주요 자동화된 프로세스가 있습니다.

  • 네이티브 커넥터를 사용하여 자동 검색 이 프로세스에는 다음 세 가지 주요 단계가 포함됩니다.

    • 메타데이터 검사
    • 자동 분류
    • Microsoft Purview 데이터 맵 메타데이터 수집
  • Azure Data Factory 및/또는 Azure Synapse 파이프라인을 사용한 자동화된 수집입니다. 이 프로세스에는 다음이 포함됩니다.

    • 계정이 Azure Data Factory 또는 Azure Synapse 파이프라인에 연결된 경우 메타데이터 및 계보를 Microsoft Purview 데이터 맵 수집합니다.

네이티브 커넥터를 사용하여 자동 검사

  • 전체 검사는 데이터 원본의 선택한 scope 내의 모든 자산을 처리하는 반면, 증분 검사는 이전의 성공적인 검사 이후 생성, 수정 또는 삭제된 자산을 검색하고 처리합니다.

  • 모든 검사(전체 또는 증분 검사)는 업데이트, 수정 또는 삭제된 자산을 선택합니다.

  • 서로 다른 부서에 속한 여러 사용자 또는 그룹이 동일한 데이터 원본에 대한 검사를 설정하여 중복 검사에 대한 가격 책정을 높일 때 시나리오를 고려하고 피하는 것이 중요합니다.

  • 데이터 자산의 변경 내용에 맞춰 초기 전체 검사를 게시하는 빈도 증분 검사를 예약합니다. 이렇게 하면 데이터 맵이 항상 최신 상태로 유지되고 증분 검사는 전체 검사에 비해 더 적은 v 코어 시간을 소비합니다.

  • 데이터 원본에 대한 "세부 정보 보기" 링크를 사용하면 사용자가 전체 검사를 실행할 수 있습니다. 그러나 검사 규칙 집합(분류/파일 형식)이 변경된 경우를 제외하고 최적화된 검사에 대한 전체 검사 후 증분 검사를 실행하는 것이 좋습니다.

  • 부모 컬렉션에 데이터 원본을 등록 하고 다른 액세스 제어를 사용하여 자식 컬렉션에서 범위 검사를 등록하여 중복 검사 비용이 수반되지 않도록 합니다.

  • 컬렉션 권한 부여를 사용하여 세분화된 액세스 제어데이터 원본 관리자 역할을 통해 검사를 위해 데이터 원본을 등록할 수 있는 사용자를 줄입니다. 이렇게 하면 유효한 데이터 원본만 등록할 수 있으며 v 코어 시간 검사를 제어하여 검사 비용이 절감됩니다.

  • 데이터 원본의 유형과 검사되는 자산 수가 검사 기간에 영향을 미친다는 점을 고려합니다.

  • 사용자 지정 검사 규칙 집합을 만들어 최적의 스캐너 사용을 보장하기 위해 비즈니스 요구 사항과 관련된 데이터 자산 및 분류에서 사용할 수 있는 파일 형식의 하위 집합만 포함합니다.

  • 데이터 원본에 대한 새 검사를 만드는 동안 실제로 검사를 실행하기 전에 권장되는 준비 순서 를 따릅니다. 여기에는 여러 검사를 방지하고 누락된 요구 사항을 통해 여러 검사에 대한 불필요한 비용을 제어하기 위해 적절한 검사 규칙 집합을 정의할 수 있도록 비즈니스별 분류파일 형식 (스토리지 계정의 경우)에 대한 요구 사항을 수집하는 것이 포함됩니다.

  • 가상 머신에 연결된 추가 비용을 방지하기 위해 검사 일정을 SHIR(Self-Hosted Integration Runtime) VM(Virtual Machines) 크기에 맞춥니다.

Azure Data Factory 및/또는 Azure Synapse 파이프라인을 사용한 자동화된 수집

  • 메타데이터 및 계보는 원본 시스템에서 파이프라인이 실행될 때마다 Azure Data Factory 또는 Azure Synapse 파이프라인에서 수집됩니다.

고급 리소스 집합

  • Microsoft Purview 데이터 맵 리소스 집합을 사용하여 데이터 레이크의 모든 파일을 검색하고 패턴(GUID, 지역화 패턴 등)을 찾아 데이터 맵에서 단일 자산으로 그룹화하는 기능을 제공하여 많은 수의 데이터 자산을 단일 논리 리소스에 매핑하는 문제를 해결합니다.

  • 고급 리소스 집합 은 고객이 총 크기, 파티션 수 등과 같이 계산된 보강된 리소스 집합 정보를 가져올 수 있도록 하고 패턴 규칙을 통해 리소스 집합 그룹화를 사용자 지정할 수 있는 선택적 기능입니다. 고급 리소스 집합 기능을 사용하도록 설정하지 않으면 통합 카탈로그 리소스 집합 자산을 포함하지만 집계된 속성은 포함하지 않습니다. 이 경우 고객에게 청구되는 "리소스 집합" 미터는 없습니다.

  • Microsoft Purview 데이터 맵 고급 리소스 집합을 켜기 전에 기본 리소스 집합 기능을 사용하여 요구 사항이 충족되는지 확인합니다.

  • 다음과 같은 경우 고급 리소스 집합을 켜는 것이 좋습니다.

    • 데이터 레이크 스키마는 지속적으로 변화하고 있으며, Microsoft Purview 데이터 맵 #partitions, 데이터 자산의 크기 등과 같은 매개 변수를 서비스로 계산할 수 있도록 기본 리소스 집합 기능 이외의 더 많은 가치를 찾고 있습니다.
    • 리소스 집합 자산이 그룹화되는 방법을 사용자 지정해야 합니다.
  • 고급 리소스 집합에 대한 청구는 오프라인 계층에서 리소스 집합 정보를 집계하는 데 사용하는 컴퓨팅을 기반으로 하며 카탈로그의 리소스 집합 크기/수에 따라 달라집니다.

다음 단계