Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Importante
Esta característica está en versión preliminar pública.
En esta página se explica cómo usar metadatos semánticos en vistas de métricas para mejorar la visualización de datos y mejorar la precisión del modelo de lenguaje grande (LLM).
Nota:
Requiere Databricks Runtime 17.2 o superior. Las definiciones de YAML de la vista de métricas deben usar la versión 1.1 o posterior de la especificación. Consulte Registro de cambios de especificación de versión para obtener más información.
¿Qué son los metadatos semánticos?
Los metadatos semánticos incluyen nombres para mostrar, especificaciones de formato y sinónimos que proporcionan contexto adicional. Estos metadatos ayudan a las herramientas de visualización, como los paneles de IA/BI y las herramientas de lenguaje natural, como espacios de Genie, interpretar y trabajar con los datos de forma más eficaz. Los metadatos semánticos se definen en la definición de YAML de una vista de métrica.
Nota:
Al crear o modificar vistas de métricas con la versión 1.1 de la especificación, se quitan los comentarios de una sola línea (indicados con #) en la definición de YAML cuando se guarda la definición. Consulte Actualización de YAML a 1.1 para obtener opciones y recomendaciones al actualizar las definiciones de YAML existentes.
Nombres para mostrar
Los nombres para mostrar proporcionan etiquetas legibles que aparecen en herramientas de visualización en lugar de nombres de columna técnicos. Los nombres para mostrar están limitados a 255 caracteres.
En el ejemplo siguiente se muestran nombres para mostrar definidos en la dimensión order_date y la medida total_revenue.
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
display_name: 'Order Date'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
display_name: 'Total Revenue'
Synonyms
Los sinónimos ayudan a las herramientas de LLM, como AI/BI Genie, a detectar dimensiones y medidas a través de la entrada del usuario proporcionando nombres alternativos. Puede definir sinónimos mediante el estilo de bloque o el estilo de flujo YAML. Cada dimensión o medida puede tener hasta 10 sinónimos. Cada sinónimo está limitado a 255 caracteres.
En el ejemplo siguiente se muestran sinónimos definidos en la order_date dimensión:
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
# block style
synonyms:
- 'order time'
- 'date of order'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
# flow style
synonyms: ['revenue', 'total sales']
Especificaciones de formato
Las especificaciones de formato definen cómo se deben mostrar los valores en las herramientas de visualización. Las tablas siguientes incluyen ejemplos y tipos de formato admitidos.
Formatos numéricos
| Tipo de formato | Opciones necesarias | Opciones opcionales |
|---|---|---|
| Número: use el formato de número simple para los valores numéricos generales con posibilidad opcional de control de posición decimal y opciones de abreviatura. | type: number |
|
| Moneda: use el formato de moneda para los valores monetarios con códigos de moneda ISO-4217. | type: currency |
|
| Porcentaje: use el formato de porcentaje para los valores de proporción expresados como porcentajes. | type: percentage |
|
Ejemplos de formato numérico
Number
format:
type: number
decimal_places:
type: max
places: 2
hide_group_separator: false
abbreviation: compact
Moneda
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
Porcentaje
format:
type: percentage
decimal_places:
type: all
hide_group_separator: true
Formatos de fecha y hora
En la tabla siguiente se explica cómo trabajar con formatos de fecha y hora.
| Tipo de formato | Opciones necesarias | Opciones opcionales |
|---|---|---|
| Fecha: use el formato de fecha para los valores de fecha con varias opciones de presentación. |
|
|
| DateTime: use el formato datetime para los valores de marca de tiempo que combinan fecha y hora. |
|
|
Nota:
Cuando se trabaja con un tipo de date_time, al menos uno de date_format o time_format debe especificar un valor distinto de no_date o no_time.
Ejemplos de formato de fecha y hora
Fecha
format:
type: date
date_format: year_month_day
leading_zeros: true
DateTime
format:
type: date_time
date_format: year_month_day
time_format: locale_hour_minute_second
leading_zeros: false
Ejemplo completo
En el ejemplo siguiente se muestra una definición de vista de métrica que incluye todos los tipos de metadatos semánticos:
version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
- name: order_date
expr: o_orderdate
comment: Date when the order was placed
display_name: Order Date
format:
type: date
date_format: year_month_day
leading_zeros: true
synonyms:
- order time
- date of order
- name: customer_segment
expr: |
CASE
WHEN o_totalprice > 100000 THEN 'Enterprise'
WHEN o_totalprice > 10000 THEN 'Mid-market'
ELSE 'SMB'
END
comment: Customer classification based on order value
display_name: Customer Segment
synonyms:
- segment
- customer tier
measures:
- name: total_revenue
expr: SUM(o_totalprice)
comment: Total revenue from all orders
display_name: Total Revenue
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
synonyms:
- revenue
- total sales
- sales amount
- name: order_count
expr: COUNT(1)
comment: Total number of orders
display_name: Order Count
format:
type: number
decimal_places:
type: all
hide_group_separator: true
synonyms:
- count
- number of orders
- name: avg_order_value
expr: SUM(o_totalprice) / COUNT(1)
comment: Average revenue per order
display_name: Average Order Value
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
synonyms:
- aov
- average revenue