다음을 통해 공유


메트릭 뷰 만들기

이 페이지에서는 SQL 또는 UI를 사용하여 메트릭 뷰를 만드는 방법을 보여 주는 예제에서 사용되는 데이터 모델 및 고려 사항에 대해 설명합니다.

샘플 데이터 세트 개요

SQL을 사용하여 메트릭 뷰를 만들고 관리하고카탈로그 탐색기 UI를 사용하여 메트릭 뷰를 만드는 예제에서는 기본적으로 Unity 카탈로그 데이터 세트에서 사용할 수 있는 TPC-H 데이터 세트를 사용합니다.

TPC-H 데이터 세트는 의사 결정 지원 시스템과 쿼리 성능을 평가하는 데 사용되는 표준 벤치마크 데이터 세트입니다. 도매 공급망 비즈니스를 모델로 하고 주문, 고객, 공급업체 및 부품과 같은 일반적인 비즈니스 운영을 중심으로 구성됩니다. 이는 고객이 여러 국가 및 지역에 걸쳐 다양한 공급업체가 제공하는 부품에 대한 주문을 하는 판매 및 유통 환경을 나타냅니다.

스키마에는 8개 테이블이 있습니다.

  • REGIONNATION: 이러한 테이블은 위치를 정의합니다.

  • CUSTOMERSUPPLIER: 이러한 표에서는 비즈니스 엔터티를 설명합니다.

  • PARTPARTSUPP: 이러한 테이블은 제품 정보 및 공급업체 가용성을 캡처합니다.

  • ORDERSLINEITEM: 이러한 테이블은 주문 내의 제품을 자세히 설명하는 품목과 함께 트랜잭션을 나타냅니다.

TPC-H 데이터 세트 ERD

다음 다이어그램에서는 테이블 간의 관계를 설명합니다.

TPC-H 엔터티 관계 다이어그램은 테이블 간의 관계를 보여 줍니다.

범례:

  • 각 테이블 이름 뒤의 괄호에는 해당 테이블의 열 이름 접두사를 포함합니다.
  • 화살표는 테이블 간의 일대다 관계의 방향을 가리킵니다.
  • 각 테이블 이름 아래의 숫자/수식은 테이블의 카디널리티(행 수)를 나타냅니다. 일부는 선택한 데이터베이스 크기를 얻기 위해 SF( Scale Factor)에 의해 고려됩니다. LINEITEM 테이블의 카디널리티는 근사값입니다(절 4.2.5 참조).

(원본: TPC 벤치마크 H 표준 사양)

메트릭 뷰 정의

SQL DDL 또는 카탈로그 탐색기 UI를 사용하여 메트릭 보기를 정의할 수 있습니다. 또는 Databricks Assistant를 사용하면 메트릭 뷰 만들기를 시작할 수 있습니다. 그런 다음 제공된 SQL DDL을 편집하거나 UI의 메트릭 뷰 편집기를 사용하여 제안된 정의를 구체화할 수 있습니다.

이 섹션의 예제에 대해 정의된 메트릭 뷰는 영업 또는 재무 분석가가 회사의 주문과 관련된 KPI(핵심 성과 지표)를 모니터링하도록 설계되었습니다. 다음과 같은 질문에 대답하는 데 도움이 될 수 있습니다.

  • 시간이 지남에 따라 총 수익 추세는 어떻게 되었나요?
  • 현재 주문의 상태별 세부사항(열림, 처리 중, 완료)은 무엇인가요?
  • 가장 많은 수익을 창출하는 주문 우선 순위는 무엇입니까?
  • 현재 '위험' 또는 미결제 수익(즉, 오픈 주문)의 수익은 얼마인가요?
  • 고유 고객당 평균 수익은 어떻게 됩니까?

필요한 구성 요소는 다음 표에 설명되어 있습니다.

구성 요소 YAML 필드/식 비즈니스 의미
원본 테이블 samples.tpch.orders 고객 주문 레코드를 포함하는 원시 데이터입니다.
Filter o_orderdate > '1990-01-01' 기록 또는 보관된 데이터를 제외한 1990년 1월 1일 이후에 주문한 주문에 대해서만 분석에 중점을 둡니다.
차원: 주문 월 (DATE_TRUNC('MONTH', o_orderdate)) 추세 분석(월별/연도별 연도별)을 사용하여 시간이 지남에 따라 성능이 어떻게 변하는지 추적합니다.
차원: 주문 상태 CASE 상태를 Open, Processing, Fulfilled으로 변환하는 명령문 수명 주기 단계별로 구분할 수 있으므로 처리 및 백로그 관리에 유용합니다.
차원: 주문 우선 순위 SPLIT 주문 우선 순위의 서식을 숫자로 지정하는 문 순서의 전략적 중요성 또는 긴급도에 따라 성능을 그룹화하는 데 사용됩니다.
측정값: 주문 수 COUNT(1) 판매 활동 규모 측정
측정값: 총 수익 SUM(o_totalprice) 모든 주문의 총 판매액
측정값: 고객당 총 수익 SUM(o_totalprice) / COUNT(DISTINCT o_custkey) 고객 트랜잭션 품질을 평가하는 데 유용한 고객 값 메트릭입니다.
측정값: 오픈 오더의 총 수익 SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') 미수익 수익 또는 판매 대기중인 주문의 값입니다. 예측 및 위험 평가에 사용됩니다.

Databricks 길잡이에게 질문하기

Databricks Assistant는 메트릭 뷰 정의를 시작하는 데 도움이 될 수 있습니다.

  1. 스파클 채우기 아이콘 을 클릭합니다. Databricks 작업 영역의 오른쪽 위 모서리에 있는 도우미 아이콘을 클릭하여 도우미를 엽니다.
  2. 만들려는 메트릭 뷰에 대한 설명을 입력합니다. Assistant는 요청과 일치하려고 시도하는 SQL DDL을 반환합니다.
  3. 제공된 SQL을 복사하여 SQL 편집기에 붙여넣습니다. 그런 다음 실행을 클릭합니다.
  4. SQL을 편집하거나 메트릭 뷰 편집기를 열어 조정합니다.

새 메트릭 뷰 만들기

다음 예제 중 하나를 사용하여 새 메트릭 뷰를 만듭니다.