Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Esta página explica o modelo de dados e as considerações usadas nos exemplos que mostram como criar uma exibição de métrica usando SQL ou a interface do usuário.
Visão geral do conjunto de dados de exemplo
Os exemplos fornecidos em Usar SQL para criar e gerenciar exibições de métricas e Criar uma exibição de métrica usando a interface do usuário do Catalog Explorer usam o conjunto de dados TPC-H, que está disponível por padrão em conjuntos de dados do Catálogo Unity.
O conjunto de dados TPC-H é um conjunto de dados de referência padrão usado para avaliar sistemas de apoio à decisão e desempenho de consultas. Ele modela um negócio de cadeia de suprimentos por atacado e é estruturado em torno de operações comerciais comuns, como pedidos, clientes, fornecedores e peças. Representa um ambiente de vendas e distribuição, onde os clientes fazem pedidos de peças fornecidas por vários fornecedores em diferentes nações e regiões.
O esquema tem 8 tabelas:
REGIONeNATION: Estas tabelas definem a localização.CUSTOMEReSUPPLIER: Estas tabelas descrevem entidades comerciais.PARTePARTSUPP: Estas tabelas capturam informações sobre produtos e disponibilidade de fornecedores.ORDERSeLINEITEM: Estas tabelas representam transações, com itens de linha detalhando produtos dentro de pedidos.
TPC-H conjunto de dados ERD
O diagrama a seguir explica as relações entre as tabelas.
Legenda:
- Os parênteses seguintes a cada nome de tabela contêm o prefixo dos nomes das colunas dessa tabela;
- As setas apontam na direção das relações um-para-muitos entre tabelas;
- O número/fórmula abaixo do nome de cada tabela representa a cardinalidade (número de linhas) da tabela. Alguns são fatorados pelo SF, o Fator de Escala, para obter o tamanho do banco de dados escolhido. A cardinalidade para a tabela LINEITEM é aproximada (ver Cláusula 4.2.5).
(fonte: TPC Benchmark H Standard Specification)
Definir uma vista métrica
Você pode definir uma exibição de métrica usando DDL SQL ou a interface do usuário do Catalog Explorer. Como alternativa, o Databricks Assistant pode ajudá-lo a começar a criar sua visualização métrica. Em seguida, você pode editar a DDL SQL fornecida ou usar o editor de exibição métrica na interface do usuário para refinar a definição sugerida.
A visualização métrica definida para os exemplos nesta seção foi projetada para que um analista de vendas ou financeiro monitore indicadores-chave de desempenho (KPIs) relacionados aos pedidos da empresa. Pode ajudar a responder a perguntas como:
- Como tem evoluído a nossa receita total ao longo do tempo?
- Qual é a repartição atual das nossas encomendas por estado (Aberto, Processado, Cumprido)?
- Quais prioridades de ordem geram mais receita?
- Quanta receita está atualmente "em risco" ou pendente (ou seja, de ordens abertas)?
- Qual é a receita média gerada por cliente único?
Os componentes necessários são descritos na tabela a seguir:
| Componente | Campo/expressão YAML | Significado empresarial |
|---|---|---|
| Tabela de origem | samples.tpch.orders |
Os dados brutos que contêm registros de pedidos de clientes. |
| Filter | o_orderdate > '1990-01-01' |
Concentra a análise apenas em pedidos feitos após 1º de janeiro de 1990, provavelmente excluindo dados históricos ou arquivados. |
| Dimensão: Mês da encomenda | (DATE_TRUNC('MONTH', o_orderdate)) |
Permite a análise de tendências (mês a mês/ano a ano), acompanhando como o desempenho muda ao longo do tempo. |
| Dimensão: Estado da Encomenda |
CASE declaração que traduz o status para Open, Processingou Fulfilled |
Permite a segmentação por estágio do ciclo de vida, útil para o cumprimento e gerenciamento de listas de pendências. |
| Dimensão: Prioridade do pedido |
SPLIT Declaração que formata a prioridade do pedido como um número |
Usado para agrupar o desempenho pela importância estratégica ou urgência da ordem. |
| Medida: Contagem de pedidos | COUNT(1) |
Mede o volume da atividade de vendas |
| Medida: Receita Total | SUM(o_totalprice) |
O valor bruto de vendas de todos os pedidos |
| Medida: Receita Total por Cliente | SUM(o_totalprice) / COUNT(DISTINCT o_custkey) |
Uma métrica de valor do cliente útil para avaliar a qualidade da transação do cliente. |
| Medida: Receita Total para Pedidos em Aberto | SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') |
O valor da receita não obtida ou a carteira de vendas atual. Utilizado para previsão e avaliação de riscos. |
Pergunte ao Assistente Databricks
O Databricks Assistant pode ajudá-lo a começar a definir uma visualização métrica.
- Clique no
o ícone Assistente no canto superior direito da área de trabalho do Databricks para abrir o assistente.
- Digite uma descrição da exibição de métrica que você deseja criar. O Assistente retorna DDL SQL que tenta corresponder à sua solicitação.
- Copie o SQL fornecido e cole-o no editor SQL. Em seguida, clique em Executar.
- Edite o SQL ou abra o editor de exibição de métricas para fazer ajustes.
Criar uma nova vista métrica
Use um dos seguintes exemplos para criar uma nova exibição de métrica: