Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Esta página explica como usar metadados semânticos em exibições métricas para aprimorar a visualização de dados e melhorar a precisão do modelo de linguagem grande (LLM).
Observação
Requer Databricks Runtime 17.2 ou superior. As definições de YAML de visualização métrica devem usar a especificação versão 1.1 ou superior. Consulte histórico de alterações da especificação de versão para obter detalhes.
O que são metadados semânticos?
Os metadados semânticos incluem nomes para exibição, especificações de formato e sinônimos que fornecem contexto adicional. Esses metadados ajudam as ferramentas de visualização, como painéis de IA/BI, e ferramentas de linguagem natural, como espaços Genie, a interpretar e trabalhar com seus dados de forma mais eficaz. Os metadados semânticos são definidos na definição YAML de uma visualização métrica.
Observação
Quando você cria ou altera exibições de métricas com a especificação versão 1.1, todos os comentários de linha única (indicados com #) na definição YAML são removidos quando a definição é salva. Consulte Atualizar seu YAML para 1.1 para obter opções e recomendações ao atualizar as definições de YAML existentes.
Nomes para exibição
Os nomes de exibição fornecem rótulos legíveis por humanos que aparecem em ferramentas de visualização em vez de nomes de colunas técnicas. Os nomes de exibição são limitados a 255 caracteres.
O exemplo a seguir mostra nomes de exibição definidos na order_date dimensão e na total_revenue medida.
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
display_name: 'Order Date'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
display_name: 'Total Revenue'
Synonyms
Os sinônimos ajudam as ferramentas LLM, como o AI/BI Genie, a descobrir dimensões e medidas por meio da entrada do usuário, fornecendo nomes alternativos. Você pode definir sinônimos usando o estilo de bloco ou o estilo de fluxo YAML. Cada dimensão ou medida pode ter até 10 sinónimos. Cada sinónimo está limitado a 255 caracteres.
O exemplo seguinte mostra sinónimos definidos na dimensão:
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
# block style
synonyms:
- 'order time'
- 'date of order'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
# flow style
synonyms: ['revenue', 'total sales']
Especificações de formato
As especificações de formato definem como os valores devem ser exibidos nas ferramentas de visualização. As tabelas a seguir incluem tipos de formato suportados e exemplos.
Formatos numéricos
| Tipo de formato | Opções Necessárias | Opções opcionais |
|---|---|---|
| Número: Utilize o formato de número simples para valores gerais numéricos, com opções de controlo opcional de casas decimais e abreviação. | type: number |
|
| Moeda: Use o formato de moeda para valores monetários com códigos de moeda ISO-4217. | type: currency |
|
| Porcentagem: Use o formato de porcentagem para valores de proporção expressos em porcentagens. | type: percentage |
|
Exemplos de formatação numérica
Número
format:
type: number
decimal_places:
type: max
places: 2
hide_group_separator: false
abbreviation: compact
Moeda
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
Percentagem
format:
type: percentage
decimal_places:
type: all
hide_group_separator: true
Formatos de data e hora
A tabela a seguir explica como trabalhar com formatos de data e hora.
| Tipo de formato | Opções Necessárias | Opções opcionais |
|---|---|---|
| Data: use o formato de data para valores de data com várias opções de exibição. |
|
|
| DateTime: Utilize o formato DateTime para carimbos de data e hora, combinando data e hora. |
|
|
Observação
Ao trabalhar com um date_time tipo, pelo menos um de date_format ou time_format deve especificar um valor diferente de no_date ou no_time.
Exemplos de formatação de data/hora
Date
format:
type: date
date_format: year_month_day
leading_zeros: true
DateTime
format:
type: date_time
date_format: year_month_day
time_format: locale_hour_minute_second
leading_zeros: false
Exemplo completo
O exemplo a seguir mostra uma definição de exibição métrica que inclui todos os tipos de metadados semânticos:
version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
- name: order_date
expr: o_orderdate
comment: Date when the order was placed
display_name: Order Date
format:
type: date
date_format: year_month_day
leading_zeros: true
synonyms:
- order time
- date of order
- name: customer_segment
expr: |
CASE
WHEN o_totalprice > 100000 THEN 'Enterprise'
WHEN o_totalprice > 10000 THEN 'Mid-market'
ELSE 'SMB'
END
comment: Customer classification based on order value
display_name: Customer Segment
synonyms:
- segment
- customer tier
measures:
- name: total_revenue
expr: SUM(o_totalprice)
comment: Total revenue from all orders
display_name: Total Revenue
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
synonyms:
- revenue
- total sales
- sales amount
- name: order_count
expr: COUNT(1)
comment: Total number of orders
display_name: Order Count
format:
type: number
decimal_places:
type: all
hide_group_separator: true
synonyms:
- count
- number of orders
- name: avg_order_value
expr: SUM(o_totalprice) / COUNT(1)
comment: Average revenue per order
display_name: Average Order Value
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
synonyms:
- aov
- average revenue