Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Von Bedeutung
Dieses Feature befindet sich in der Public Preview.
Auf dieser Seite wird erläutert, wie Sie semantische Metadaten in Metrikansichten verwenden, um die Datenvisualisierung zu verbessern und die LLM-Genauigkeit (Large Language Model) zu verbessern.
Hinweis
Erfordert Databricks Runtime 17.2 oder höher. YaML-Definitionen der Metrikansicht müssen die Spezifikation Version 1.1 oder höher verwenden. Details finden Sie im Änderungsprotokoll zur Versionsspezifikation .
Was ist semantische Metadaten?
Semantische Metadaten umfassen Anzeigenamen, Formatspezifikationen und Synonyme, die zusätzlichen Kontext bereitstellen. Diese Metadaten helfen Visualisierungstools, wie KI/BI-Dashboards, und natursprachlichen Werkzeugen, wie Genie-Räume, Ihre Daten effektiver zu interpretieren und mit ihnen zu arbeiten. Semantische Metadaten werden in der YAML-Definition einer Metrikansicht definiert.
Hinweis
Wenn Sie Metrikansichten mit Spezifikationsversion 1.1 erstellen oder ändern, werden alle Kommentare in einer Zeile (mit #) in der YAML-Definition entfernt, wenn die Definition gespeichert wird. Informationen zu Optionen und Empfehlungen beim Aktualisieren vorhandener YAML-Definitionen finden Sie unter Upgrade Ihres YAML auf 1.1 .
Anzeigenamen
Anzeigenamen bieten lesbare Bezeichnungen, die in Visualisierungstools anstelle von technischen Spaltennamen angezeigt werden. Anzeigenamen sind auf 255 Zeichen beschränkt.
Das folgende Beispiel zeigt Anzeigenamen, die für die Dimension order_date und das Maß total_revenue definiert sind.
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
display_name: 'Order Date'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
display_name: 'Total Revenue'
Synonyme
Synonyme helfen LLM-Tools wie AI/BI Genie, Dimensionen und Maße durch Benutzereingaben zu entdecken, indem sie alternative Namen bereitstellen. Sie können Synonyme entweder mithilfe von Blockstil oder Flow-Stil YAML definieren. Jede Dimension oder jedes Maß kann bis zu 10 Synonyme aufweisen. Jedes Synonym ist auf 255 Zeichen beschränkt.
Das folgende Beispiel zeigt Synonyme, die für die order_date Dimension definiert sind:
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
# block style
synonyms:
- 'order time'
- 'date of order'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
# flow style
synonyms: ['revenue', 'total sales']
Formatspezifikationen
Formatspezifikationen definieren, wie Werte in Visualisierungstools angezeigt werden sollen. Die folgenden Tabellen enthalten unterstützte Formattypen und Beispiele.
Numerische Formate
| Formattyp | Erforderliche Optionen | Optionale Optionen |
|---|---|---|
| Zahl: Verwenden Sie einfaches Zahlenformat für allgemeine numerische Werte mit optionalen Dezimalplatz-Steuerelementen und Abkürzungsoptionen. | type: number |
|
| Währung: Währungsformat für Geldwerte mit ISO-4217-Währungscodes verwenden. | type: currency |
|
| Prozentsatz: Verwenden Sie das Prozentformat für Verhältniswerte, die als Prozentwerte ausgedrückt werden. | type: percentage |
|
Beispiele für numerische Formatierungen
Number
format:
type: number
decimal_places:
type: max
places: 2
hide_group_separator: false
abbreviation: compact
Währung
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
Prozentsatz
format:
type: percentage
decimal_places:
type: all
hide_group_separator: true
Datums- und Uhrzeitformate
In der folgenden Tabelle wird erläutert, wie Sie mit Datums- und Uhrzeitformaten arbeiten.
| Formattyp | Erforderliche Optionen | Optionale Optionen |
|---|---|---|
| Datum: Verwenden Sie das Datumsformat für Datumswerte mit verschiedenen Anzeigeoptionen. |
|
|
| DateTime: Verwenden Sie das Datetime-Format für Zeitstempelwerte, die Datum und Uhrzeit kombinieren. |
|
|
Hinweis
Wenn Sie mit einem date_time-Typ arbeiten, müssen mindestens date_format oder time_format einen anderen Wert als no_date oder no_time angeben.
Datetime-Formatierungsbeispiele
Datum
format:
type: date
date_format: year_month_day
leading_zeros: true
DateTime
format:
type: date_time
date_format: year_month_day
time_format: locale_hour_minute_second
leading_zeros: false
Vollständiges Beispiel
Das folgende Beispiel zeigt eine Definition der Metrikansicht, die alle semantischen Metadatentypen enthält:
version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
- name: order_date
expr: o_orderdate
comment: Date when the order was placed
display_name: Order Date
format:
type: date
date_format: year_month_day
leading_zeros: true
synonyms:
- order time
- date of order
- name: customer_segment
expr: |
CASE
WHEN o_totalprice > 100000 THEN 'Enterprise'
WHEN o_totalprice > 10000 THEN 'Mid-market'
ELSE 'SMB'
END
comment: Customer classification based on order value
display_name: Customer Segment
synonyms:
- segment
- customer tier
measures:
- name: total_revenue
expr: SUM(o_totalprice)
comment: Total revenue from all orders
display_name: Total Revenue
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
synonyms:
- revenue
- total sales
- sales amount
- name: order_count
expr: COUNT(1)
comment: Total number of orders
display_name: Order Count
format:
type: number
decimal_places:
type: all
hide_group_separator: true
synonyms:
- count
- number of orders
- name: avg_order_value
expr: SUM(o_totalprice) / COUNT(1)
comment: Average revenue per order
display_name: Average Order Value
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
synonyms:
- aov
- average revenue