Partilhar via


Criar uma vista métrica

Esta página explica o modelo de dados e as considerações usadas nos exemplos que mostram como criar uma exibição de métrica usando SQL ou a interface do usuário.

Visão geral do conjunto de dados de exemplo

Os exemplos fornecidos em Usar SQL para criar e gerenciar exibições de métricas e Criar uma exibição de métrica usando a interface do usuário do Catalog Explorer usam o conjunto de dados TPC-H, que está disponível por padrão em conjuntos de dados do Catálogo Unity.

O conjunto de dados TPC-H é um conjunto de dados de referência padrão usado para avaliar sistemas de apoio à decisão e desempenho de consultas. Ele modela um negócio de cadeia de suprimentos por atacado e é estruturado em torno de operações comerciais comuns, como pedidos, clientes, fornecedores e peças. Representa um ambiente de vendas e distribuição, onde os clientes fazem pedidos de peças fornecidas por vários fornecedores em diferentes nações e regiões.

O esquema tem 8 tabelas:

  • REGION e NATION: Estas tabelas definem a localização.

  • CUSTOMER e SUPPLIER: Estas tabelas descrevem entidades comerciais.

  • PART e PARTSUPP: Estas tabelas capturam informações sobre produtos e disponibilidade de fornecedores.

  • ORDERS e LINEITEM: Estas tabelas representam transações, com itens de linha detalhando produtos dentro de pedidos.

TPC-H conjunto de dados ERD

O diagrama a seguir explica as relações entre as tabelas.

TPC-H diagrama de relação de entidade mostra as relações entre tabelas.

Legenda:

  • Os parênteses seguintes a cada nome de tabela contêm o prefixo dos nomes das colunas dessa tabela;
  • As setas apontam na direção das relações um-para-muitos entre tabelas;
  • O número/fórmula abaixo do nome de cada tabela representa a cardinalidade (número de linhas) da tabela. Alguns são fatorados pelo SF, o Fator de Escala, para obter o tamanho do banco de dados escolhido. A cardinalidade para a tabela LINEITEM é aproximada (ver Cláusula 4.2.5).

(fonte: TPC Benchmark H Standard Specification)

Definir uma vista métrica

Você pode definir uma exibição de métrica usando DDL SQL ou a interface do usuário do Catalog Explorer. Como alternativa, o Databricks Assistant pode ajudá-lo a começar a criar sua visualização métrica. Em seguida, você pode editar a DDL SQL fornecida ou usar o editor de exibição métrica na interface do usuário para refinar a definição sugerida.

A visualização métrica definida para os exemplos nesta seção foi projetada para que um analista de vendas ou financeiro monitore indicadores-chave de desempenho (KPIs) relacionados aos pedidos da empresa. Pode ajudar a responder a perguntas como:

  • Como tem evoluído a nossa receita total ao longo do tempo?
  • Qual é a repartição atual das nossas encomendas por estado (Aberto, Processado, Cumprido)?
  • Quais prioridades de ordem geram mais receita?
  • Quanta receita está atualmente "em risco" ou pendente (ou seja, de ordens abertas)?
  • Qual é a receita média gerada por cliente único?

Os componentes necessários são descritos na tabela a seguir:

Componente Campo/expressão YAML Significado empresarial
Tabela de origem samples.tpch.orders Os dados brutos que contêm registros de pedidos de clientes.
Filter o_orderdate > '1990-01-01' Concentra a análise apenas em pedidos feitos após 1º de janeiro de 1990, provavelmente excluindo dados históricos ou arquivados.
Dimensão: Mês da encomenda (DATE_TRUNC('MONTH', o_orderdate)) Permite a análise de tendências (mês a mês/ano a ano), acompanhando como o desempenho muda ao longo do tempo.
Dimensão: Estado da Encomenda CASE declaração que traduz o status para Open, Processingou Fulfilled Permite a segmentação por estágio do ciclo de vida, útil para o cumprimento e gerenciamento de listas de pendências.
Dimensão: Prioridade do pedido SPLIT Declaração que formata a prioridade do pedido como um número Usado para agrupar o desempenho pela importância estratégica ou urgência da ordem.
Medida: Contagem de pedidos COUNT(1) Mede o volume da atividade de vendas
Medida: Receita Total SUM(o_totalprice) O valor bruto de vendas de todos os pedidos
Medida: Receita Total por Cliente SUM(o_totalprice) / COUNT(DISTINCT o_custkey) Uma métrica de valor do cliente útil para avaliar a qualidade da transação do cliente.
Medida: Receita Total para Pedidos em Aberto SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') O valor da receita não obtida ou a carteira de vendas atual. Utilizado para previsão e avaliação de riscos.

Pergunte ao Assistente Databricks

O Databricks Assistant pode ajudá-lo a começar a definir uma visualização métrica.

  1. Clique no ícone de preenchimento de brilho. o ícone Assistente no canto superior direito da área de trabalho do Databricks para abrir o assistente.
  2. Digite uma descrição da exibição de métrica que você deseja criar. O Assistente retorna DDL SQL que tenta corresponder à sua solicitação.
  3. Copie o SQL fornecido e cole-o no editor SQL. Em seguida, clique em Executar.
  4. Edite o SQL ou abra o editor de exibição de métricas para fazer ajustes.

Criar uma nova vista métrica

Use um dos seguintes exemplos para criar uma nova exibição de métrica: