Freigeben über


Verwenden von semantischen Metadaten in Metrikansichten

Von Bedeutung

Dieses Feature befindet sich in der Public Preview.

Auf dieser Seite wird erläutert, wie Sie semantische Metadaten in Metrikansichten verwenden, um die Datenvisualisierung zu verbessern und die LLM-Genauigkeit (Large Language Model) zu verbessern.

Hinweis

Erfordert Databricks Runtime 17.2 oder höher. YaML-Definitionen der Metrikansicht müssen die Spezifikation Version 1.1 oder höher verwenden. Details finden Sie im Änderungsprotokoll zur Versionsspezifikation .

Was ist semantische Metadaten?

Semantische Metadaten umfassen Anzeigenamen, Formatspezifikationen und Synonyme, die zusätzlichen Kontext bereitstellen. Diese Metadaten helfen Visualisierungstools, wie KI/BI-Dashboards, und natursprachlichen Werkzeugen, wie Genie-Räume, Ihre Daten effektiver zu interpretieren und mit ihnen zu arbeiten. Semantische Metadaten werden in der YAML-Definition einer Metrikansicht definiert.

Hinweis

Wenn Sie Metrikansichten mit Spezifikationsversion 1.1 erstellen oder ändern, werden alle Kommentare in einer Zeile (mit #) in der YAML-Definition entfernt, wenn die Definition gespeichert wird. Informationen zu Optionen und Empfehlungen beim Aktualisieren vorhandener YAML-Definitionen finden Sie unter Upgrade Ihres YAML auf 1.1 .

Anzeigenamen

Anzeigenamen bieten lesbare Bezeichnungen, die in Visualisierungstools anstelle von technischen Spaltennamen angezeigt werden. Anzeigenamen sind auf 255 Zeichen beschränkt.

Das folgende Beispiel zeigt Anzeigenamen, die für die Dimension order_date und das Maß total_revenue definiert sind.

version: 1.1
source: samples.tpch.orders

dimensions:
  - name: order_date
    expr: o_orderdate
    display_name: 'Order Date'

measures:
  - name: total_revenue
    expr: SUM(o_totalprice)
    display_name: 'Total Revenue'

Synonyme

Synonyme helfen LLM-Tools wie AI/BI Genie, Dimensionen und Maße durch Benutzereingaben zu entdecken, indem sie alternative Namen bereitstellen. Sie können Synonyme entweder mithilfe von Blockstil oder Flow-Stil YAML definieren. Jede Dimension oder jedes Maß kann bis zu 10 Synonyme aufweisen. Jedes Synonym ist auf 255 Zeichen beschränkt.

Das folgende Beispiel zeigt Synonyme, die für die order_date Dimension definiert sind:

version: 1.1
source: samples.tpch.orders

dimensions:
  - name: order_date
    expr: o_orderdate
    # block style
    synonyms:
      - 'order time'
      - 'date of order'

measures:
  - name: total_revenue
    expr: SUM(o_totalprice)
    # flow style
    synonyms: ['revenue', 'total sales']

Formatspezifikationen

Formatspezifikationen definieren, wie Werte in Visualisierungstools angezeigt werden sollen. Die folgenden Tabellen enthalten unterstützte Formattypen und Beispiele.

Numerische Formate

Formattyp Erforderliche Optionen Optionale Optionen
Zahl: Verwenden Sie einfaches Zahlenformat für allgemeine numerische Werte mit optionalen Dezimalplatz-Steuerelementen und Abkürzungsoptionen. type: number
  • decimal_places: Bestimmt die Anzahl der Stellen nach dem Dezimaltrennzeichen.
    • type: (Erforderlich, wenn decimal_places angegeben)
      • max
      • exact
      • all
    • places: Ganzzahliger Wert von 0-10 (erforderlich, wenn Typ ist max oder exact)
  • hide_group_separator: Wenn dieser Wert auf "true" festgelegt ist, werden alle anwendbaren Nummerngruppierungstrennzeichen entfernt, z. B. ein ,.
    • true
    • false
  • abbreviation:
    • none
    • compact
    • scientific
Währung: Währungsformat für Geldwerte mit ISO-4217-Währungscodes verwenden. type: currency
  • currency_code: ISO-4217-Code (erforderlich). Die folgenden Codes fügen z. B. das Symbol für US-Dollar, Euro und Yen ein.
    • USD
    • EUR
    • JPY
  • decimal_places: Bestimmt die Anzahl der Stellen nach dem Dezimaltrennzeichen.
    • type: (Erforderlich, wenn decimal_places angegeben)
      • max
      • exact
      • all
  • hide_group_separator: Wenn dieser Wert auf "true" festgelegt ist, werden alle anwendbaren Nummerngruppierungstrennzeichen entfernt.
    • true
    • false
  • abbreviation:
    • none
    • compact
    • scientific
Prozentsatz: Verwenden Sie das Prozentformat für Verhältniswerte, die als Prozentwerte ausgedrückt werden. type: percentage
  • decimal_places: Bestimmt die Anzahl der Stellen nach dem Dezimaltrennzeichen.
    • type: (Erforderlich, wenn decimal_places angegeben)
      • max
      • exact
      • all
  • hide_group_separator: Wenn dieser Wert auf "true" festgelegt ist, werden alle anwendbaren Nummerngruppierungstrennzeichen entfernt.
    • true
    • false

Beispiele für numerische Formatierungen

Number
format:
  type: number
  decimal_places:
    type: max
    places: 2
  hide_group_separator: false
  abbreviation: compact
Währung
format:
  type: currency
  currency_code: USD
  decimal_places:
    type: exact
    places: 2
  hide_group_separator: false
  abbreviation: compact
Prozentsatz
format:
  type: percentage
  decimal_places:
    type: all
  hide_group_separator: true

Datums- und Uhrzeitformate

In der folgenden Tabelle wird erläutert, wie Sie mit Datums- und Uhrzeitformaten arbeiten.

Formattyp Erforderliche Optionen Optionale Optionen
Datum: Verwenden Sie das Datumsformat für Datumswerte mit verschiedenen Anzeigeoptionen.
  • type: date
  • date_format: Steuert, wie das Datum angezeigt wird.
    • locale_short_month: Zeigt das Datum mit einem abgekürzten Monat an.
    • locale_long_month: Zeigt das Datum mit dem vollständigen Namen des Monats an.
    • year_month_day: Formatiert das Datum als JJJJ-MM-DD
    • locale_number_month: Zeigt das Datum mit einem Monat als Zahl an.
    • year_week: Formatiert das Datum als Jahr und eine Wochenzahl. Beispiel: 2025-W1
  • leading_zeros: Steuert, ob einstellige Zahlen einer Null vorangestellt sind.
  • true
  • false
DateTime: Verwenden Sie das Datetime-Format für Zeitstempelwerte, die Datum und Uhrzeit kombinieren.
  • type: date_time
  • date_format: Steuert, wie das Datum angezeigt wird.
    • no_date: Datum ist ausgeblendet
    • locale_short_month: Zeigt das Datum mit einem abgekürzten Monat an.
    • locale_long_month: Zeigt das Datum mit dem vollständigen Namen des Monats an.
    • year_month_day: Formatiert das Datum als JJJJ-MM-DD
    • locale_number_month: Zeigt das Datum mit einem Monat als Zahl an.
    • year_week: Formatiert das Datum als Jahr und eine Wochenzahl. Beispiel: 2025-W1
  • time_format:
    • no_time: Die Uhrzeit ist ausgeblendet.
    • locale_hour_minute: Zeigt die Stunde und Minute an.
    • locale_hour_minute_second: Zeigt die Stunde, Minute und Sekunde an.
  • leading_zeros: Steuert, ob einstellige Zahlen einer Null vorangestellt sind.
    • true
    • false

Hinweis

Wenn Sie mit einem date_time-Typ arbeiten, müssen mindestens date_format oder time_format einen anderen Wert als no_date oder no_time angeben.

Datetime-Formatierungsbeispiele

Datum
format:
  type: date
  date_format: year_month_day
  leading_zeros: true
DateTime
format:
  type: date_time
  date_format: year_month_day
  time_format: locale_hour_minute_second
  leading_zeros: false

Vollständiges Beispiel

Das folgende Beispiel zeigt eine Definition der Metrikansicht, die alle semantischen Metadatentypen enthält:

version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
  - name: order_date
    expr: o_orderdate
    comment: Date when the order was placed
    display_name: Order Date
    format:
      type: date
      date_format: year_month_day
      leading_zeros: true
    synonyms:
      - order time
      - date of order
  - name: customer_segment
    expr: |
      CASE
        WHEN o_totalprice > 100000 THEN 'Enterprise'
        WHEN o_totalprice > 10000 THEN 'Mid-market'
        ELSE 'SMB'
      END
    comment: Customer classification based on order value
    display_name: Customer Segment
    synonyms:
      - segment
      - customer tier
measures:
  - name: total_revenue
    expr: SUM(o_totalprice)
    comment: Total revenue from all orders
    display_name: Total Revenue
    format:
      type: currency
      currency_code: USD
      decimal_places:
        type: exact
        places: 2
      hide_group_separator: false
      abbreviation: compact
    synonyms:
      - revenue
      - total sales
      - sales amount
  - name: order_count
    expr: COUNT(1)
    comment: Total number of orders
    display_name: Order Count
    format:
      type: number
      decimal_places:
        type: all
      hide_group_separator: true
    synonyms:
      - count
      - number of orders
  - name: avg_order_value
    expr: SUM(o_totalprice) / COUNT(1)
    comment: Average revenue per order
    display_name: Average Order Value
    format:
      type: currency
      currency_code: USD
      decimal_places:
        type: exact
        places: 2
    synonyms:
      - aov
      - average revenue