Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Importante
Esse recurso está em Visualização Pública.
Esta página explica como usar metadados semânticos em exibições de métrica para aprimorar a visualização de dados e melhorar a precisão do LLM (modelo de linguagem grande).
Observação
Requer o Databricks Runtime 17.2 ou superior. As definições yaml de exibição de métrica devem usar a versão de especificação 1.1 ou superior. Consulte o registro de alterações das especificações de versão para obter detalhes.
O que são metadados semânticos?
Metadados semânticos incluem nomes de exibição, especificações de formato e sinônimos que fornecem contexto adicional. Esses metadados ajudam as ferramentas de visualização, como painéis de IA/BI, e ferramentas de linguagem natural, como espaços do Genie, a interpretar e trabalhar com seus dados com mais eficiência. Metadados semânticos são definidos na definição YAML de uma exibição de métrica.
Observação
Quando você cria ou altera exibições de métrica com a especificação versão 1.1, todos os comentários de linha única (indicados com #) na definição yaml são removidos quando a definição é salva. Consulte Atualizar seu YAML para 1.1 para obter opções e recomendações ao atualizar definições yaml existentes.
Nomes de exibição
Os nomes de exibição fornecem rótulos legíveis por humanos que aparecem em ferramentas de visualização em vez de nomes de colunas técnicas. Os nomes de exibição são limitados a 255 caracteres.
O exemplo a seguir mostra os nomes de exibição definidos na dimensão order_date e na medida total_revenue.
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
display_name: 'Order Date'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
display_name: 'Total Revenue'
Synonyms
Os sinônimos ajudam as ferramentas LLM, como o Genie de IA/BI, a descobrir dimensões e medidas por meio da entrada do usuário fornecendo nomes alternativos. Você pode definir sinônimos usando o estilo de bloco ou o estilo de fluxo YAML. Cada dimensão ou medida pode ter até 10 sinônimos. Cada sinônimo é limitado a 255 caracteres.
O exemplo a seguir mostra sinônimos definidos na order_date dimensão:
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
# block style
synonyms:
- 'order time'
- 'date of order'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
# flow style
synonyms: ['revenue', 'total sales']
Especificações de formato
As especificações de formato definem como os valores devem ser exibidos nas ferramentas de visualização. As tabelas a seguir incluem exemplos e tipos de formato compatíveis.
Formatos numéricos
| Tipo de formato | Opções necessárias | Opções opcionais |
|---|---|---|
| Número: use o formato de número simples para valores numéricos gerais com opções de controle de casas decimais e de abreviação. | type: number |
|
| Moeda: use o formato de moeda para valores monetários com códigos de moeda ISO-4217. | type: currency |
|
| Percentual: use o formato de porcentagem para valores de taxa expressos como porcentagens. | type: percentage |
|
Exemplos de formatação numérica
Número
format:
type: number
decimal_places:
type: max
places: 2
hide_group_separator: false
abbreviation: compact
Moeda
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
Porcentagem
format:
type: percentage
decimal_places:
type: all
hide_group_separator: true
Formatos de data e hora
A tabela a seguir explica como trabalhar com formatos de data e hora.
| Tipo de formato | Opções necessárias | Opções opcionais |
|---|---|---|
| Data: use o formato de data para valores de data com várias opções de exibição. |
|
|
| DateTime: Use o formato datetime para valores de timestamp que combinam data e hora. |
|
|
Observação
Ao trabalhar com um date_time tipo, pelo menos um de date_format ou time_format deve especificar um valor diferente de no_date ou no_time.
Exemplos de formatação de datetime
Date
format:
type: date
date_format: year_month_day
leading_zeros: true
DateTime
format:
type: date_time
date_format: year_month_day
time_format: locale_hour_minute_second
leading_zeros: false
Exemplo completo
O exemplo a seguir mostra uma definição de exibição de métrica que inclui todos os tipos de metadados semânticos:
version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
- name: order_date
expr: o_orderdate
comment: Date when the order was placed
display_name: Order Date
format:
type: date
date_format: year_month_day
leading_zeros: true
synonyms:
- order time
- date of order
- name: customer_segment
expr: |
CASE
WHEN o_totalprice > 100000 THEN 'Enterprise'
WHEN o_totalprice > 10000 THEN 'Mid-market'
ELSE 'SMB'
END
comment: Customer classification based on order value
display_name: Customer Segment
synonyms:
- segment
- customer tier
measures:
- name: total_revenue
expr: SUM(o_totalprice)
comment: Total revenue from all orders
display_name: Total Revenue
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
synonyms:
- revenue
- total sales
- sales amount
- name: order_count
expr: COUNT(1)
comment: Total number of orders
display_name: Order Count
format:
type: number
decimal_places:
type: all
hide_group_separator: true
synonyms:
- count
- number of orders
- name: avg_order_value
expr: SUM(o_totalprice) / COUNT(1)
comment: Average revenue per order
display_name: Average Order Value
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
synonyms:
- aov
- average revenue