Udostępnij przez


Używanie metadanych semantycznych w widokach metryk

Ważne

Ta funkcja jest dostępna w publicznej wersji testowej.

Na tej stronie wyjaśniono, jak używać metadanych semantycznych w widokach metryk w celu ulepszenia wizualizacji danych i zwiększenia dokładności dużego modelu językowego (LLM).

Uwaga / Notatka

Wymaga środowiska Databricks Runtime w wersji 17.2 lub nowszej. Definicje YAML widoku metryki muszą używać wersji specyfikacji 1.1 lub nowszej. Aby uzyskać szczegółowe informacje, zobacz Dziennik zmian specyfikacji wersji .

Co to są metadane semantyczne?

Metadane semantyczne zawierają nazwy wyświetlane, specyfikacje formatu i synonimy, które zapewniają dodatkowy kontekst. Te metadane pomagają narzędziom do wizualizacji, takim jak pulpity nawigacyjne sztucznej inteligencji/analizy biznesowej, oraz narzędziom języka naturalnego, takim jak przestrzenie Genie, efektywniej interpretować dane i pracować z nimi. Metadane semantyczne definiuje się w definicji YAML dla widoku metryki.

Uwaga / Notatka

Podczas tworzenia lub zmieniania widoków metryk zgodnie ze specyfikacją w wersji 1.1, wszystkie komentarze w jednej linii (oznaczone jako #) w definicji YAML są usuwane po zapisaniu definicji. Zobacz Uaktualnianie kodu YAML do wersji 1.1, aby uzyskać opcje i zalecenia dotyczące uaktualniania istniejących definicji YAML.

Nazwy wyświetlane

Nazwy wyświetlane zapewniają czytelne dla człowieka etykiety, które są wyświetlane w narzędziach wizualizacji zamiast nazw kolumn technicznych. Nazwy wyświetlane są ograniczone do 255 znaków.

W poniższym przykładzie przedstawiono nazwy wyświetlane zdefiniowane dla wymiaru order_date i miary total_revenue.

version: 1.1
source: samples.tpch.orders

dimensions:
  - name: order_date
    expr: o_orderdate
    display_name: 'Order Date'

measures:
  - name: total_revenue
    expr: SUM(o_totalprice)
    display_name: 'Total Revenue'

Synonyms

Synonimy pomagają narzędziom LLM, takim jak AI/BI Genie, odkrywać wymiary i miary dzięki wejściom użytkownika, oferując alternatywne nazwy. Synonimy można definiować przy użyciu stylu bloku lub stylu przepływu YAML. Każdy wymiar lub miara może mieć maksymalnie 10 synonimów. Każdy synonim jest ograniczony do 255 znaków.

Poniższy przykład pokazuje synonimy zdefiniowane w wymiarze order_date:

version: 1.1
source: samples.tpch.orders

dimensions:
  - name: order_date
    expr: o_orderdate
    # block style
    synonyms:
      - 'order time'
      - 'date of order'

measures:
  - name: total_revenue
    expr: SUM(o_totalprice)
    # flow style
    synonyms: ['revenue', 'total sales']

Specyfikacje formatu

Specyfikacje formatu definiują sposób wyświetlania wartości w narzędziach do wizualizacji. W poniższych tabelach znajdują się obsługiwane typy formatów i przykłady.

Formaty liczbowe

Typ formatu Wymagane opcje Opcje opcjonalne
Liczba: użyj formatu zwykłego numeru dla ogólnych wartości liczbowych z opcjonalnymi opcjami umieszczenia miejsc dziesiętnych i skrótów. type: number
  • decimal_places: określa liczbę miejsc wyświetlanych po przecinku.
    • type: (Wymagane, jeśli decimal_places określono)
      • max
      • exact
      • all
    • places: Wartość całkowita z zakresu od 0 do 10 (wymagana, jeśli typ to max lub exact)
  • hide_group_separator: W przypadku ustawienia wartości true usuwa dowolny odpowiedni separator grupowania liczb, taki jak ,.
    • true
    • false
  • abbreviation:
    • none
    • compact
    • scientific
Waluta: użyj formatu waluty dla wartości pieniężnych z kodami walut ISO-4217. type: currency
  • currency_code: kod ISO-4217 (wymagany). Na przykład poniższe kody wstawią symbol odpowiednio dla dolarów amerykańskich, euro i jena.
    • USD
    • EUR
    • JPY
  • decimal_places: określa liczbę miejsc wyświetlanych po przecinku.
    • type: (Wymagane, jeśli decimal_places określono)
      • max
      • exact
      • all
  • hide_group_separator: Po ustawieniu wartości true usuwa dowolny odpowiedni separator grupowania liczb.
    • true
    • false
  • abbreviation:
    • none
    • compact
    • scientific
Procent: użyj formatu procentowego dla wartości współczynnika wyrażonych jako wartości procentowe. type: percentage
  • decimal_places: określa liczbę miejsc wyświetlanych po przecinku.
    • type: (Wymagane, jeśli decimal_places określono)
      • max
      • exact
      • all
  • hide_group_separator: Po ustawieniu wartości true usuwa dowolny odpowiedni separator grupowania liczb.
    • true
    • false

Przykłady formatowania liczbowego

Number
format:
  type: number
  decimal_places:
    type: max
    places: 2
  hide_group_separator: false
  abbreviation: compact
Waluta
format:
  type: currency
  currency_code: USD
  decimal_places:
    type: exact
    places: 2
  hide_group_separator: false
  abbreviation: compact
Procent
format:
  type: percentage
  decimal_places:
    type: all
  hide_group_separator: true

Formaty daty i godziny

W poniższej tabeli wyjaśniono, jak pracować z formatami daty i godziny.

Typ formatu Wymagane opcje Opcje opcjonalne
Data: użyj formatu daty dla wartości daty z różnymi opcjami wyświetlania.
  • type: date
  • date_format: określa sposób wyświetlania daty
    • locale_short_month: Wyświetla datę ze skróconym miesiącem
    • locale_long_month: Wyświetla datę z pełną nazwą miesiąca
    • year_month_day: formatuje datę jako RRRR-MM-DD
    • locale_number_month: Wyświetla datę z miesiącem jako liczbę
    • year_week: formatuje datę jako rok i numer tygodnia. Na przykład 2025-W1
  • leading_zeros: Określa, czy liczby jednocyfrowe są poprzedzone zerem
  • true
  • false
Data/godzina: użyj formatu daty/godziny dla wartości znacznika czasu łączącego datę i godzinę.
  • type: date_time
  • date_format: określa sposób wyświetlania daty
    • no_date: Data jest ukryta
    • locale_short_month: Wyświetla datę ze skróconym miesiącem
    • locale_long_month: Wyświetla datę z pełną nazwą miesiąca
    • year_month_day: formatuje datę jako RRRR-MM-DD
    • locale_number_month: Wyświetla datę z miesiącem jako liczbę
    • year_week: formatuje datę jako rok i numer tygodnia. Na przykład 2025-W1
  • time_format:
    • no_time: Czas jest ukryty
    • locale_hour_minute: Wyświetla godzinę i minutę
    • locale_hour_minute_second: Wyświetla godzinę, minutę i sekundę
  • leading_zeros: Określa, czy liczby jednocyfrowe są poprzedzone zerem
    • true
    • false

Uwaga / Notatka

Podczas pracy z typem date_time co najmniej jedna z date_format lub time_format musi określić wartość inną niż no_date lub no_time.

Przykłady formatowania daty/godziny

Date
format:
  type: date
  date_format: year_month_day
  leading_zeros: true
DateTime
format:
  type: date_time
  date_format: year_month_day
  time_format: locale_hour_minute_second
  leading_zeros: false

Kompletny przykład

W poniższym przykładzie przedstawiono definicję widoku metryki, która zawiera wszystkie typy metadanych semantycznych:

version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
  - name: order_date
    expr: o_orderdate
    comment: Date when the order was placed
    display_name: Order Date
    format:
      type: date
      date_format: year_month_day
      leading_zeros: true
    synonyms:
      - order time
      - date of order
  - name: customer_segment
    expr: |
      CASE
        WHEN o_totalprice > 100000 THEN 'Enterprise'
        WHEN o_totalprice > 10000 THEN 'Mid-market'
        ELSE 'SMB'
      END
    comment: Customer classification based on order value
    display_name: Customer Segment
    synonyms:
      - segment
      - customer tier
measures:
  - name: total_revenue
    expr: SUM(o_totalprice)
    comment: Total revenue from all orders
    display_name: Total Revenue
    format:
      type: currency
      currency_code: USD
      decimal_places:
        type: exact
        places: 2
      hide_group_separator: false
      abbreviation: compact
    synonyms:
      - revenue
      - total sales
      - sales amount
  - name: order_count
    expr: COUNT(1)
    comment: Total number of orders
    display_name: Order Count
    format:
      type: number
      decimal_places:
        type: all
      hide_group_separator: true
    synonyms:
      - count
      - number of orders
  - name: avg_order_value
    expr: SUM(o_totalprice) / COUNT(1)
    comment: Average revenue per order
    display_name: Average Order Value
    format:
      type: currency
      currency_code: USD
      decimal_places:
        type: exact
        places: 2
    synonyms:
      - aov
      - average revenue