이 페이지에서는 SQL 또는 UI를 사용하여 메트릭 뷰를 만드는 방법을 보여 주는 예제에서 사용되는 데이터 모델 및 고려 사항에 대해 설명합니다.
샘플 데이터 세트 개요
SQL을 사용하여 메트릭 뷰를 만들고 관리하고카탈로그 탐색기 UI를 사용하여 메트릭 뷰를 만드는 예제에서는 기본적으로 Unity 카탈로그 데이터 세트에서 사용할 수 있는 TPC-H 데이터 세트를 사용합니다.
TPC-H 데이터 세트는 의사 결정 지원 시스템과 쿼리 성능을 평가하는 데 사용되는 표준 벤치마크 데이터 세트입니다. 도매 공급망 비즈니스를 모델로 하고 주문, 고객, 공급업체 및 부품과 같은 일반적인 비즈니스 운영을 중심으로 구성됩니다. 이는 고객이 여러 국가 및 지역에 걸쳐 다양한 공급업체가 제공하는 부품에 대한 주문을 하는 판매 및 유통 환경을 나타냅니다.
스키마에는 8개 테이블이 있습니다.
REGION및NATION: 이러한 테이블은 위치를 정의합니다.CUSTOMER및SUPPLIER: 이러한 표에서는 비즈니스 엔터티를 설명합니다.PART및PARTSUPP: 이러한 테이블은 제품 정보 및 공급업체 가용성을 캡처합니다.ORDERS및LINEITEM: 이러한 테이블은 주문 내의 제품을 자세히 설명하는 품목과 함께 트랜잭션을 나타냅니다.
TPC-H 데이터 세트 ERD
다음 다이어그램에서는 테이블 간의 관계를 설명합니다.
범례:
- 각 테이블 이름 뒤의 괄호에는 해당 테이블의 열 이름 접두사를 포함합니다.
- 화살표는 테이블 간의 일대다 관계의 방향을 가리킵니다.
- 각 테이블 이름 아래의 숫자/수식은 테이블의 카디널리티(행 수)를 나타냅니다. 일부는 선택한 데이터베이스 크기를 얻기 위해 SF( Scale Factor)에 의해 고려됩니다. LINEITEM 테이블의 카디널리티는 근사값입니다(절 4.2.5 참조).
(원본: TPC 벤치마크 H 표준 사양)
메트릭 뷰 정의
SQL DDL 또는 카탈로그 탐색기 UI를 사용하여 메트릭 보기를 정의할 수 있습니다. 또는 Databricks Assistant를 사용하면 메트릭 뷰 만들기를 시작할 수 있습니다. 그런 다음 제공된 SQL DDL을 편집하거나 UI의 메트릭 뷰 편집기를 사용하여 제안된 정의를 구체화할 수 있습니다.
이 섹션의 예제에 대해 정의된 메트릭 뷰는 영업 또는 재무 분석가가 회사의 주문과 관련된 KPI(핵심 성과 지표)를 모니터링하도록 설계되었습니다. 다음과 같은 질문에 대답하는 데 도움이 될 수 있습니다.
- 시간이 지남에 따라 총 수익 추세는 어떻게 되었나요?
- 현재 주문의 상태별 세부사항(열림, 처리 중, 완료)은 무엇인가요?
- 가장 많은 수익을 창출하는 주문 우선 순위는 무엇입니까?
- 현재 '위험' 또는 미결제 수익(즉, 오픈 주문)의 수익은 얼마인가요?
- 고유 고객당 평균 수익은 어떻게 됩니까?
필요한 구성 요소는 다음 표에 설명되어 있습니다.
| 구성 요소 | YAML 필드/식 | 비즈니스 의미 |
|---|---|---|
| 원본 테이블 | samples.tpch.orders |
고객 주문 레코드를 포함하는 원시 데이터입니다. |
| Filter | o_orderdate > '1990-01-01' |
기록 또는 보관된 데이터를 제외한 1990년 1월 1일 이후에 주문한 주문에 대해서만 분석에 중점을 둡니다. |
| 차원: 주문 월 | (DATE_TRUNC('MONTH', o_orderdate)) |
추세 분석(월별/연도별 연도별)을 사용하여 시간이 지남에 따라 성능이 어떻게 변하는지 추적합니다. |
| 차원: 주문 상태 |
CASE 상태를 Open, Processing, Fulfilled으로 변환하는 명령문 |
수명 주기 단계별로 구분할 수 있으므로 처리 및 백로그 관리에 유용합니다. |
| 차원: 주문 우선 순위 |
SPLIT 주문 우선 순위의 서식을 숫자로 지정하는 문 |
순서의 전략적 중요성 또는 긴급도에 따라 성능을 그룹화하는 데 사용됩니다. |
| 측정값: 주문 수 | COUNT(1) |
판매 활동 규모 측정 |
| 측정값: 총 수익 | SUM(o_totalprice) |
모든 주문의 총 판매액 |
| 측정값: 고객당 총 수익 | SUM(o_totalprice) / COUNT(DISTINCT o_custkey) |
고객 트랜잭션 품질을 평가하는 데 유용한 고객 값 메트릭입니다. |
| 측정값: 오픈 오더의 총 수익 | SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') |
미수익 수익 또는 판매 대기중인 주문의 값입니다. 예측 및 위험 평가에 사용됩니다. |
Databricks 길잡이에게 질문하기
Databricks Assistant는 메트릭 뷰 정의를 시작하는 데 도움이 될 수 있습니다.
-
을 클릭합니다. Databricks 작업 영역의 오른쪽 위 모서리에 있는 도우미 아이콘을 클릭하여 도우미를 엽니다.
- 만들려는 메트릭 뷰에 대한 설명을 입력합니다. Assistant는 요청과 일치하려고 시도하는 SQL DDL을 반환합니다.
- 제공된 SQL을 복사하여 SQL 편집기에 붙여넣습니다. 그런 다음 실행을 클릭합니다.
- SQL을 편집하거나 메트릭 뷰 편집기를 열어 조정합니다.
새 메트릭 뷰 만들기
다음 예제 중 하나를 사용하여 새 메트릭 뷰를 만듭니다.