Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Important
Cette fonctionnalité est disponible en préversion publique. Vous pouvez confirmer l’inscription en préversion sur la page Aperçus . Consultez Gérer les préversions d’Azure Databricks.
Cette page explique comment utiliser des métadonnées sémantiques dans les vues de métriques pour améliorer la visualisation des données et améliorer la précision du modèle de langage volumineux (LLM).
Note
Nécessite Databricks Runtime 17.2 ou version ultérieure. Les définitions YAML de la vue métrique doivent utiliser la version 1.1 ou ultérieure de la spécification. Pour plus d’informations, consultez le journal des modifications de spécification de version .
Qu’est-ce que les métadonnées sémantiques ?
Les métadonnées sémantiques incluent des noms d’affichage, des spécifications de format et des synonymes qui fournissent un contexte supplémentaire. Ces métadonnées aident les outils de visualisation, tels que les tableaux de bord IA/BI et les outils en langage naturel, tels que les espaces Génie, interpréter et travailler plus efficacement avec vos données. Les métadonnées sémantiques sont définies dans la définition YAML d’une vue de métrique.
Note
Lorsque vous créez ou modifiez des vues métriques avec la version 1.1 de la spécification, tous les commentaires à ligne unique (indiqués avec #) dans la définition YAML sont supprimés lorsque la définition est enregistrée. Consultez Mettre à niveau votre YAML vers la version 1.1 pour obtenir des options et des recommandations lors de la mise à niveau des définitions YAML existantes.
Noms d’affichage
Les noms d’affichage fournissent des étiquettes visuelles faciles à lire qui apparaissent dans les outils de visualisation au lieu de noms de colonnes techniques. Les noms d’affichage sont limités à 255 caractères.
L'exemple suivant présente les noms d’affichage définis sur la dimension order_date et la mesure total_revenue.
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
display_name: 'Order Date'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
display_name: 'Total Revenue'
Synonyms
Les synonymes aident les outils LLM, tels que AI/BI Genie, à découvrir des dimensions et des mesures par le biais d’entrées utilisateur en fournissant d’autres noms. Vous pouvez définir des synonymes à l’aide d’un style de bloc ou d’un style de flux YAML. Chaque dimension ou mesure peut avoir jusqu’à 10 synonymes. Chaque synonyme est limité à 255 caractères.
L’exemple suivant montre des synonymes définis sur la order_date dimension :
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
# block style
synonyms:
- 'order time'
- 'date of order'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
# flow style
synonyms: ['revenue', 'total sales']
Spécifications de format
Les spécifications de format définissent la façon dont les valeurs doivent être affichées dans les outils de visualisation. Les tableaux suivants incluent les types et exemples de format pris en charge.
Formats numériques
| Type de format | Options requises | Options facultatives |
|---|---|---|
| Nombre : utilisez le format numérique brut pour les valeurs numériques générales avec des options facultatives de contrôle de place décimale et d’abréviation. | type: number |
|
| Devise : utilisez le format monétaire pour les valeurs monétaires avec des codes monétaires ISO-4217. | type: currency |
|
| Pourcentage : utilisez le format de pourcentage pour les valeurs de ratio exprimées en pourcentages. | type: percentage |
|
Exemples de mise en forme numérique
Number
format:
type: number
decimal_places:
type: max
places: 2
hide_group_separator: false
abbreviation: compact
Monnaie
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
Pourcentage
format:
type: percentage
decimal_places:
type: all
hide_group_separator: true
Formats de date et d’heure
Le tableau suivant explique comment utiliser les formats de date et d’heure.
| Type de format | Options requises | Options facultatives |
|---|---|---|
| Date : utilisez le format de date pour les valeurs de date avec différentes options d’affichage. |
|
|
| DateTime : utilisez le format datetime pour les valeurs d’horodatage combinant date et heure. |
|
|
Note
Lors de l’utilisation d’un type date_time, au moins date_format ou time_format doit spécifier une valeur différente de no_date ou no_time.
Exemples de mise en forme Datetime
Date
format:
type: date
date_format: year_month_day
leading_zeros: true
Date et heure
format:
type: date_time
date_format: year_month_day
time_format: locale_hour_minute_second
leading_zeros: false
Exemple complet
L’exemple suivant montre une définition de vue de métrique qui inclut tous les types de métadonnées sémantiques :
version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
- name: order_date
expr: o_orderdate
comment: Date when the order was placed
display_name: Order Date
format:
type: date
date_format: year_month_day
leading_zeros: true
synonyms:
- order time
- date of order
- name: customer_segment
expr: |
CASE
WHEN o_totalprice > 100000 THEN 'Enterprise'
WHEN o_totalprice > 10000 THEN 'Mid-market'
ELSE 'SMB'
END
comment: Customer classification based on order value
display_name: Customer Segment
synonyms:
- segment
- customer tier
measures:
- name: total_revenue
expr: SUM(o_totalprice)
comment: Total revenue from all orders
display_name: Total Revenue
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
synonyms:
- revenue
- total sales
- sales amount
- name: order_count
expr: COUNT(1)
comment: Total number of orders
display_name: Order Count
format:
type: number
decimal_places:
type: all
hide_group_separator: true
synonyms:
- count
- number of orders
- name: avg_order_value
expr: SUM(o_totalprice) / COUNT(1)
comment: Average revenue per order
display_name: Average Order Value
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
synonyms:
- aov
- average revenue