Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Na tej stronie opisano sposób modelowania widoków metryk i najlepszych rozwiązań dotyczących pracy z nimi.
Widoki metryk ułatwiają tworzenie warstwy semantycznej dla danych, przekształcanie nieprzetworzonych tabel na standardowe metryki przyjazne dla firmy. Określają, co należy mierzyć, jak je agregować i jak go segmentować, zapewniając, że każdy użytkownik w organizacji zgłasza tę samą liczbę dla tego samego kluczowego wskaźnika wydajności (KPI). Celem jest utworzenie pojedynczego źródła prawdy dla metryk biznesowych.
Modelowanie danych jako widoków metryk pozwala wyodrębnić złożone dane SQL, struktury tabel i problemy z jakością danych, co pozwala analitykom skupić się wyłącznie na analizie.
Podstawowe składniki
Modelowanie widoku metryki obejmuje zdefiniowanie następujących elementów na podstawie danych źródłowych:
| Składnik | Description | Example |
|---|---|---|
| Źródło | Tabela podstawowa, widok lub zapytanie SQL zawierające nieprzetworzone dane transakcyjne. | samples.tpch.orders |
| Wymiary | Atrybuty kolumny używane do segmentowania lub grupowania metryk | Kategoria produktu, Miesiąc zamówienia, Region klienta |
| Środki | Agregacje kolumn, które generują metryki. Te środki to te, o których zwykle się raportuje. |
COUNT(o_order_id) jako Liczba zamówień, SUM(o_total_price) jako Łączny przychód. |
| Filtry | Warunki trwałe zastosowane do danych źródłowych w celu zdefiniowania zakresu. |
|
Definiowanie źródła
Możesz użyć elementu zawartości podobnej do tabeli lub zapytania SQL jako źródła widoku metryki. Aby użyć elementu podobnego do tabeli, musisz mieć co najmniej SELECT uprawnienia do tego zasobu.
Używanie tabeli jako źródła
Aby użyć tabeli jako źródła, dołącz w pełni kwalifikowaną nazwę tabeli, jak w poniższym przykładzie.
source: samples.tpch.orders
Używanie zapytania SQL jako źródła
Aby użyć zapytania SQL, napisz tekst zapytania bezpośrednio w języku YAML.
source: SELECT * FROM samples.tpch.orders o
LEFT JOIN samples.tpch.customer c
ON o.o_custkey = c.c_custkey
Uwaga / Notatka
W przypadku używania zapytania SQL jako źródła z klauzulą JOIN usługa Databricks zaleca ustawienie ograniczeń klucza podstawowego i obcego w tabelach bazowych oraz, w celu osiągnięcia optymalnej wydajności podczas wykonywania zapytań, użycie opcji RELY, jeśli ma to zastosowanie. Aby uzyskać więcej informacji na temat używania ograniczeń klucza podstawowego i obcego, zobacz Deklarowanie relacji klucza podstawowego i klucza obcego oraz Optymalizacja zapytań przy użyciu ograniczeń klucza podstawowego.
Użyj widoku metryki jako źródła
Możesz również użyć istniejącego widoku metryki jako źródła dla nowego widoku metryki:
version: 1.1
source: views.examples.source_metric_view
dimensions:
# Dimension referencing dimension from source_metric_view
- name: Order date
expr: order_date_dim
measures:
# Measure referencing dimension from source_metric_view
- name: Latest order month
expr: MAX(order_date_dim_month)
# Measure referencing measure from source_metric_view
- name: Latest order year
expr: DATE_TRUNC('year', MEASURE(max_order_date_measure))
W przypadku korzystania z widoku metryki jako źródła te same reguły komponowania mają zastosowanie do odwoływania się do wymiarów i miar. Zobacz Kompozycyjność.
Wymiary
Wymiary to kolumny używane w klauzulach SELECT, WHERE i GROUP BY w czasie wykonywania zapytania. Każde wyrażenie musi zwracać wartość skalarną. Wymiary są definiowane jako tablica. Każdy wymiar składa się z dwóch składników:
name: alias kolumny.expr: wyrażenie SQL w danych źródłowych, które definiuje wymiar lub wcześniej zdefiniowany wymiar w widoku metryki.
Uwaga / Notatka
Począwszy od wersji 1.1, można również zdefiniować semantyczne metadane (nazwa wyświetlana, format i synonimy) dla każdego wymiaru. Aby uzyskać szczegółowe informacje, zobacz Use semantic metadata in metric views (Używanie metadanych semantycznych w widokach metryk ).
Środki
Miary to kolumny zdefiniowane jako tablica wyrażeń, które generują wyniki bez wstępnie określonego poziomu agregacji. Muszą być wyrażane przy użyciu funkcji agregujących. Aby odwołać się do miary w zapytaniu, należy użyć MEASURE funkcji . Miary mogą odwoływać się do pól bazowych w danych źródłowych lub wcześniej zdefiniowanych wymiarach. Każda miara składa się z następujących składników:
name: alias miary.expr: agregujące wyrażenie SQL, które może zawierać funkcje agregujące SQL.
W poniższym przykładzie przedstawiono typowe wzorce miar:
measures:
# Simple count measure
- name: Order Count
expr: COUNT(1)
# Sum aggregation measure
- name: Total Revenue
expr: SUM(o_totalprice)
# Distinct count measure
- name: Unique Customers
expr: COUNT(DISTINCT o_custkey)
# Calculated measure combining multiple aggregations
- name: Average Order Value
expr: SUM(o_totalprice) / COUNT(DISTINCT o_orderkey)
# Filtered measure with WHERE condition
- name: High Priority Order Revenue
expr: SUM(o_totalprice) FILTER (WHERE o_orderpriority = '1-URGENT')
# Measure using a dimension
- name: Average Revenue per Month
expr: SUM(o_totalprice) / COUNT(DISTINCT DATE_TRUNC('MONTH', o_orderdate))
Zobacz Funkcje agregujące , aby uzyskać listę funkcji agregujących.
Zobacz measure funkcja agregująca.
Uwaga / Notatka
Począwszy od wersji 1.1, można również zdefiniować metadane semantyczne (nazwa wyświetlana, format i synonimy) dla każdej miary. Aby uzyskać szczegółowe informacje, zobacz Use semantic metadata in metric views (Używanie metadanych semantycznych w widokach metryk ).
Stosowanie filtrów
Filtr w definicji YAML widoku metryki ma zastosowanie do wszystkich zapytań odwołujących się do niego. Musi być zapisywana jako wyrażenie logiczne SQL i jest równoważna użyciu WHERE klauzuli w zapytaniu SQL.
W poniższym przykładzie przedstawiono typowe wzorce filtrów:
# Single condition filter
filter: o_orderdate > '2024-01-01'
# Multiple conditions with AND
filter: o_orderdate > '2024-01-01' AND o_orderstatus = 'F'
# Multiple conditions with OR
filter: o_orderpriority = '1-URGENT' OR o_orderpriority = '2-HIGH'
# Complex filter with IN clause
filter: o_orderstatus IN ('F', 'P') AND o_orderdate >= '2024-01-01'
# Filter with NOT
filter: o_orderstatus != 'O' AND o_totalprice > 1000.00
# Filter with LIKE pattern matching
filter: o_comment LIKE '%express%' AND o_orderdate > '2024-01-01'
Filtry można również dodawać podczas wykonywania zapytań lub korzystania z widoków metryk.
Zaawansowane możliwości modelowania
Modelowanie widoków metryk obsługuje zaawansowane techniki tworzenia wyrafinowanych i wielokrotnego użytku metryk.
Dołącza
Łączenia umożliwiają wzbogacenie widoku na metryki o atrybuty opisowe z powiązanych tabel. Można użyć złączeń do modelowania relacji z tabeli faktów do tabel wymiarów (schemat gwiazdy) i do przechodzenia z wymiarów do podwymiarów, co umożliwia wieloetapowe złączenia przez znormalizowane tabele wymiarowe (schemat płatka śniegu).
Zobacz Używanie sprzężeń w widokach metryk.
Miary okien
Ważne
Ta funkcja jest eksperymentalna.
Miary okienne umożliwiają definiowanie miar za pomocą agregacji okiennych, kumulacyjnych lub częściowoaddytywnych w widokach metryk. Te typy miar umożliwiają wykonywanie bardziej złożonych obliczeń, takich jak średnie ruchome, zmiany okresowe i sumy bieżące. Zobacz Używanie miar okien w widokach metryk, aby zapoznać się z przykładami, które pokazują, jak używać miar okien w widokach metryk.
Składalność
Widoki metryk są komponowalne, co umożliwia tworzenie złożonej logiki przez odwoływanie się do wcześniej zdefiniowanych elementów. Można odwoływać się do wcześniej zdefiniowanych wymiarów w nowych wymiarach, odwoływać się do dowolnych wymiarów lub wcześniej zdefiniowanych miar w nowych miarach oraz odwoływać się do kolumn ze sprzężeń zdefiniowanych w widoku metryki.
Zobacz Kompozycyjność w widokach metryk.
Metadane semantyczne
Metadane semantyczne ułatwiają korzystanie z narzędzi do zrozumienia sposobu wyświetlania i traktowania miar i wymiarów. Obejmuje to właściwości, takie jak:
| Metadane semantyczne | Example |
|---|---|
| Nazwy wyświetlane |
Total Revenue zamiast sum_o_price. |
| Format wyświetlania | Standaryzacja formatowania dla waluty, wartości procentowych i dat. |
| Comments | Wyjaśnienie definicji biznesowej metryki w języku naturalnym. |
Podczas definiowania metadanych semantycznych jest ona przenoszona za pomocą metryki. Na przykład gdy analitycy używają łącznego przychodu na pulpicie nawigacyjnym, jest on automatycznie wyświetlany jako waluta.
Zobacz Używanie metadanych semantycznych w widokach metryk.
Składnia i formatowanie YAML
Definicje widoku metryki są zgodne ze standardową składnią notacji YAML. Zobacz dokumentację składni YAML , aby dowiedzieć się więcej o wymaganej składni i formatowaniu w celu zdefiniowania widoku metryki. Zobacz dokumentację specyfikacji YAML 1.2.2 , aby dowiedzieć się więcej na temat specyfikacji YAML.
Wymiary okien
Miary okna obliczają wartość w zdefiniowanym oknie lub zakres wierszy powiązanych z bieżącym wierszem. Miary okien można używać do analizy szeregów czasowych i porównawczych, umożliwiając definiowanie metryk, takich jak:
- Kroczący 30-dniowy całkowity przychód: suma przychodów w ciągu ostatnich 30 dni
- Przychody od początku roku (YTD): suma skumulowana od początku roku
- Porównanie poprzedniego okresu: przychód z poprzedniego miesiąca
Zobacz Używanie miar okna w widokach metrycznych.
Najlepsze rozwiązania dotyczące modelowania widoków metryk
Podczas modelowania widoków metryk użyj następujących wytycznych:
-
Miary atomowe modelu: najpierw zdefiniuj najprostsze, niewyliczane miary (na przykład
SUM(revenue),COUNT(DISTINCT customer_id)). Tworzenie złożonych miar (takich jak AOV) przy użyciu kompilowania. -
Ustandaryzuj wartości wymiarów: użyj przekształceń (takich jak
CASEinstrukcje lub wyrażenia), aby przekonwertować tajemnicze kody baz danych na jasne nazwy biznesowe (na przykład przekonwertować stan zamówienia "O" na "Otwarte" i "F" na "Spełnione"). - Definiowanie zakresu za pomocą filtrów: Bądź celowy w stosowaniu filtrów trwałych. Jeśli widok metryki powinien zawsze zawierać tylko ukończone zamówienia, zdefiniuj ten filtr w widoku metryki, aby użytkownicy nie mogli przypadkowo uwzględnić niekompletnych danych.
-
Użyj przyjaznego dla firmy nazewnictwa: nazwy metryk powinny być natychmiast rozpoznawalne dla użytkowników biznesowych (na przykład Wartość okresu istnienia klienta a
cltv_agg_measure). - Wymiary czasu oddzielnego: zawsze obejmują wymiary czasu szczegółowego (takie jak Data zamówienia) i obcinane wymiary czasu (takie jak Miesiąc zamówienia lub Tydzień zamówienia), aby obsługiwać zarówno szczegółowe analizy na poziomie szczegółowości, jak i trendu.