Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Esta página explica o modelo de dados e as considerações usadas nos exemplos que mostram como criar uma exibição de métrica usando o SQL ou a interface do usuário.
Visão geral do conjunto de dados de exemplo
Os exemplos fornecidos no Use SQL para criar e gerenciar exibições de métrica e criar uma exibição de métrica usando a interface do usuário do Gerenciador de Catálogos usam o conjunto de dados TPC-H, que está disponível por padrão em conjuntos de dados do Catálogo do Unity.
O conjunto de dados TPC-H é um conjunto de dados de parâmetro de comparação padrão usado para avaliar os sistemas de suporte à decisão e o desempenho da consulta. Ele modela um negócio de cadeia de suprimentos por atacado e é estruturado em torno de operações comerciais comuns, como pedidos, clientes, fornecedores e peças. Representa um ambiente de vendas e distribuição, em que os clientes fazem pedidos de peças fornecidas por vários fornecedores em diferentes nações e regiões.
O esquema tem 8 tabelas:
REGIONeNATION: essas tabelas definem o local.CUSTOMEReSUPPLIER: essas tabelas descrevem entidades de negócios.PARTePARTSUPP: essas tabelas capturam informações do produto e disponibilidade do fornecedor.ORDERSeLINEITEM: essas tabelas representam transações, com itens de linha detalhando produtos dentro de pedidos.
ERD do conjunto de dados TPC-H
O diagrama a seguir explica as relações entre as tabelas.
Legenda:
- Os parênteses que seguem cada nome de tabela contêm o prefixo dos nomes de coluna para essa tabela;
- As setas apontam na direção das relações um-para-muitos entre tabelas;
- O número/fórmula abaixo de cada nome de tabela representa a cardinalidade (número de linhas) da tabela. Alguns são levados em conta pelo SF, o Fator de Escala, para obter o tamanho do banco de dados escolhido. A cardinalidade da tabela LINEITEM é aproximada (consulte a Cláusula 4.2.5).
(origem: Especificação padrão do TPC Benchmark H)
Definir uma visualização de métrica
Você pode definir uma exibição de métrica usando a DDL do SQL ou a interface do usuário do Catalog Explorer. Como alternativa, o Assistente do Databricks pode ajudá-lo a começar a criar sua exibição de métrica. Em seguida, você pode editar a DDL do SQL fornecida ou usar o editor de exibição de métrica na interface do usuário para refinar a definição sugerida.
A exibição de métrica definida para os exemplos nesta seção foi projetada para que um analista financeiro ou de vendas monitore os principais KPIs (indicadores de desempenho) relacionados aos pedidos da empresa. Ele pode ajudar a responder perguntas como:
- Como nossa receita total aumentou ao longo do tempo?
- Qual é a divisão atual de nossos pedidos por status (Abrir, Processar, Cumprir)?
- Quais prioridades de ordem geram mais receita?
- Quanto de receita está atualmente 'em risco' ou pendente (ou seja, de pedidos abertos)?
- Qual é a receita média gerada por cliente exclusivo?
Os componentes necessários são descritos na tabela a seguir:
| Componente | Campo/expressão YAML | Significado comercial |
|---|---|---|
| Tabela de origem | samples.tpch.orders |
Os dados brutos que contêm registros de pedidos de clientes. |
| Filter | o_orderdate > '1990-01-01' |
Concentra a análise somente em pedidos feitos após 1º de janeiro de 1990, provavelmente excluindo dados históricos ou arquivados. |
| Dimensão: Mês do Pedido | (DATE_TRUNC('MONTH', o_orderdate)) |
Habilita a análise de tendência (mês a mês/ano ao longo do ano), acompanhando como o desempenho muda ao longo do tempo. |
| Dimensão: Status do Pedido |
CASE instrução que converte o status em Open, Processingou Fulfilled |
Permite a segmentação por estágio do ciclo de vida, útil para o gerenciamento de execução e pendências. |
| Dimensão: Prioridade do Pedido |
SPLIT instrução que formata a prioridade da ordem como um número |
Usado para agrupar o desempenho pela importância estratégica ou urgência da ordem. |
| Medida: Contagem de Pedidos | COUNT(1) |
Mede a atividade de vendas de volume |
| Medida: Receita Total | SUM(o_totalprice) |
O valor bruto de vendas de todos os pedidos |
| Medida: Receita Total por Cliente | SUM(o_totalprice) / COUNT(DISTINCT o_custkey) |
Uma métrica de valor do cliente útil para avaliar a qualidade da transação do cliente. |
| Medida: Receita Total para Pedidos Abertos | SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') |
O valor da receita não obtida ou da pendência de vendas atual. Usado para previsão e avaliação de risco. |
Pergunte ao Assistente do Databricks
O Assistente do Databricks pode ajudá-lo a começar a definir uma exibição de métrica.
- Clique no
no canto superior direito do workspace do Databricks para abrir o ícone assistente.
- Digite uma descrição da exibição de métrica que você deseja criar. O Assistente retorna uma DDL SQL que busca atender à sua solicitação.
- Copie o SQL fornecido e cole-o no editor do SQL. Em seguida, clique em Executar.
- Edite o SQL ou abra o editor de exibição de métrica para fazer ajustes.
Criar uma nova exibição de métrica
Use um dos seguintes exemplos para criar uma nova exibição de métrica: