Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Este tutorial descreve as etapas e considerações para implementar uma arquitetura medalhão usando vistas materializadas do lago. Ao final deste tutorial, você aprenderá os principais recursos e capacidades das visualizações materializadas do lago e poderá criar um fluxo de trabalho automatizado de transformação de dados. Este tutorial não se destina a ser uma arquitetura de referência, uma lista exaustiva de recursos e funcionalidades ou uma recomendação de práticas recomendadas específicas.
Pré-requisitos
Como pré-requisitos para este tutorial, conclua as seguintes etapas:
- Inicie sessão na sua conta do Power BI ou, se ainda não tiver uma conta, inscreva-se para uma avaliação gratuita.
- Habilite o Microsoft Fabric em seu locatário. Selecione o ícone padrão do Power BI no canto inferior esquerdo da tela e selecione Malha.
- Crie um espaço de trabalho habilitado para Microsoft Fabric.
- Selecione um espaço de trabalho na guia Espaços de trabalho, selecione + Novo item e escolha Pipeline. Forneça um nome para seu pipeline e selecione Criar.
- Crie um Lakehouse com esquemas ativados . Nomeie-o SalesLakehouse e carregue arquivos de dados de exemplo no Lakehouse. Para obter mais informações, consulte Tutorial do Lakehouse.
Descrição geral do cenário
Neste tutorial, você vai dar um exemplo de uma organização de varejo fictícia, a Contoso, que usa uma arquitetura medalhão para análise de dados para obter informações acionáveis sobre suas operações de vendas no varejo. O objetivo é agilizar o processo de análise e gerar insights mais profundos sobre o desempenho dos negócios, organizando seus dados em três camadas: bronze (dados brutos), prata (dados limpos e enriquecidos) e ouro (dados agregados e analisados).
O diagrama seguinte representa diferentes entidades em cada camada da arquitetura medallion no SalesLakehouse.
Entidades
Pedidos: Esta entidade inclui detalhes sobre cada pedido do cliente, como data do pedido, detalhes da remessa, categoria do produto e subcategoria. Perceções podem ser obtidas para otimizar as estratégias de envio, identificar categorias de produtos populares e melhorar a gestão de encomendas.
Vendas: ao analisar dados de vendas, a Contoso pode avaliar métricas importantes, como receita total, margens de lucro, prioridades de pedidos e descontos. As correlações entre esses fatores fornecem uma compreensão mais clara dos comportamentos de compra dos clientes e da eficiência das estratégias de desconto.
Localização: captura a dimensão geográfica de vendas e pedidos, incluindo cidades, estados, regiões e segmentos de clientes. Ele ajuda a Contoso a identificar regiões de alto desempenho, abordar áreas de baixo desempenho e personalizar estratégias para segmentos de clientes específicos.
Desempenho do agente: com detalhes sobre os agentes que gerenciam transações, suas comissões e dados de vendas, a Contoso pode avaliar o desempenho individual do agente, incentivar os melhores desempenhos e projetar estruturas de comissão eficazes.
Comissões de agentes: A incorporação de dados de comissões garante transparência e permite uma melhor gestão de custos. Compreender a correlação entre as taxas de comissão e o desempenho dos agentes ajuda a refinar os sistemas de incentivos.
Conjunto de dados de exemplo
A Contoso mantém seus dados brutos de operações de varejo no formato CSV no ADLS Gen2. Utilizamos esses dados para criar a camada de bronze e, em seguida, usamos a camada de bronze para criar as vistas materializadas do lago que formam as camadas de prata e ouro da arquitetura do medalhão. Primeiro, baixe os arquivos CSV de exemplo do repositório de amostras do Fabric.
Criar a linha de produção
As etapas de alto nível são as seguintes:
- Camada de bronze: Ingerir dados brutos na forma de arquivos CSV na casa do lago.
- Camada de prata: limpe os dados usando vistas materializadas do lago.
- Gold Layer: Organize dados para análises e relatórios usando vistas materializadas do lago.
Crie uma camada bronze de arquitetura de medalhão analítico de vendas
Carregue os arquivos CSV correspondentes a entidades diferentes dos dados baixados no Lakehouse. Para fazer isso, navegue até sua casa do lago e carregue os dados baixados na seção Arquivos da casa do lago. Ele cria uma pasta chamada tutorial.
Em seguida, crie um atalho para ele na seção Tabelas . Selecione ... ao lado da seção Tabelas e selecione Novo atalho de esquema e, em seguida, Microsoft OneLake. Escolha o SalesLakehouse nos tipos de fonte de dados. Expanda a seção Arquivos e escolha a pasta do tutorial e selecione Criar. Você também pode usar outras opções alternativas para obter dados no Lakehouse.
Na seção Tabelas , renomeie a pasta do tutorial como bronze.
Crie camadas prateadas e douradas de arquitetura em estilo medalhão
Carregue o ficheiro de caderno baixado para a sua área de trabalho.
Abra o Caderno da Lakehouse. Para obter mais informações, consulte Explorar os dados da lakehouse com um notebook.
Execute todas as células do caderno usando Spark SQL para criar visualizações materializadas de lago aplicando restrições de qualidade de dados. Assim que todas as células forem executadas com êxito, atualize a fonte SalesLakehouse para visualizar os views materializados do lago recém-criados para o esquema prata e ouro.
Agendar o processo
Uma vez que as vistas materializadas do lago para as camadas de prata e ouro são criadas, navegue até a casa do lago e selecione Vista do lago materializada gerenciada para ver a vista da linhagem. É gerado automaticamente com base em dependências, cada visão de lago materializada dependente forma os nós da linhagem.
Selecione Agendar na faixa de opções de navegação. Ative a agenda de atualização e configuração.
Monitorizar e resolver problemas
O menu suspenso lista as execuções atuais e históricas.
Ao selecionar qualquer uma das corridas, você pode encontrar os detalhes materializados da vista do lago no painel do lado direito. O painel de atividades na parte inferior fornece um resumo geral do status de execução do nódulo.
Selecione qualquer nó na linhagem para ver os detalhes de execução desse nó e aceder aos logs detalhados. Se o status do nó for Falha, uma mensagem de erro também será exibida.
Selecionar o link Logs detalhados redirecionará você para o Hub do Monitor de onde você pode acessar os logs de erros do Spark para solução de problemas adicionais.
Selecione o botão Relatório de qualidade de dados na faixa de opções da página de visualizações materializadas do lago, para criar ou ver um relatório de qualidade de dados gerado automaticamente.