Compartilhar via


Tutorial do Lakehouse: criar um lakehouse, ingerir dados de exemplo e criar um relatório

Nesse tutorial, você cria um lakehouse, ingere dados de exemplo na tabela Delta, aplica a transformação quando necessário e, em seguida, cria relatórios. Aqui está uma lista de verificação das etapas que você concluir:

Se você não tiver o Microsoft Fabric, inscreva-se para obter uma capacidade de avaliação gratuita.

Pré-requisitos

Por que preciso do OneDrive para este tutorial?

Você precisa do OneDrive para este tutorial porque o processo de ingestão de dados depende do OneDrive como o mecanismo de armazenamento subjacente para uploads de arquivos. Quando você carrega um arquivo CSV no Fabric, ele é armazenado temporariamente em sua conta do OneDrive antes de ser ingerido no lakehouse. Essa integração garante a transferência de arquivos segura e perfeita dentro do ecossistema do Microsoft 365.

A etapa de ingestão não funcionará se você não tiver o OneDrive configurado, pois o Fabric não poderá acessar o arquivo carregado. Se você já tiver os dados disponíveis em seu lakehouse ou em outro local com suporte, o OneDrive não será necessário.

Observação

Se você já tiver dados em seu lakehouse, poderá usar esses dados em vez do arquivo CSV de exemplo. Para verificar se os dados já estão associados ao lakehouse, use o Lakehouse Explorer ou o endpoint analítico SQL para explorar tabelas, arquivos e pastas. Para obter mais informações sobre como realizar a verificação, consulte a visão geral do Lakehouse e as consultas nas tabelas do Lakehouse com o endpoint de análise SQL.

Criar um lakehouse

Nesta seção, você cria um lakehouse no Fabric.

  1. No Fabric, selecione Workspaces na barra de navegação.

  2. Para abrir seu espaço de trabalho, insira o nome dele na caixa de pesquisa localizada na parte superior e selecione-o nos resultados da pesquisa.

  3. No workspace, selecione Novo item, insira Lakehouse na caixa de pesquisa e selecione Lakehouse.

  4. Na caixa de diálogo Novo lakehouse, insira wwilakehouse no campo Nome .

    Captura de tela da caixa de diálogo New lakehouse.

  5. Selecione Criar para criar e abrir o novo lakehouse.

Ingerir dados de exemplo

Nesta seção, você ingerirá dados de cliente de exemplo no lakehouse.

Observação

Se você não tiver o OneDrive configurado, inscreva-se na avaliação gratuita do Microsoft 365: Avaliação gratuita - Experimente o Microsoft 365 por um mês.

  1. Baixe o arquivo dimension_customer.csv do repositório de exemplos do Fabric.

  2. Na guia Início, em Obter dados no lakehouse, você verá as opções para carregar dados no lakehouse. Selecione Novo Fluxo de Dados Gen2.

    Captura de tela mostrando onde selecionar a opção Novo Fluxo de Dados Gen2 para carregar dados no lakehouse.

  3. No painel Criar um fluxo de dados , insira Dados de Dimensão do Cliente no campo Nome e selecione Avançar.

    Captura de tela do painel Criar um fluxo de dados, mostrando onde inserir o nome do fluxo de dados.

  4. No novo painel de fluxo de dados, selecione Importar de um arquivo de texto ou CSV.

  5. No painel Conectar-se à fonte de dados, selecione o botão de opção Carregar arquivo. Arraste e solte o arquivo dedimension_customer.csv que você baixou na etapa 1. Depois que o arquivo for carregado, selecione Avançar.

    Captura de tela mostrando onde selecionar Carregar arquivo e onde arrastar o arquivo baixado anteriormente.

  6. Na página Visualizar dados do arquivo , visualize os dados e selecione Criar para continuar e retornar à tela de fluxo de dados.

Transformar e carregar dados na lakehouse

Nesta seção, você transformará os dados com base em seus requisitos de negócios e os carregará no lakehouse.

  1. No painel Configurações de Consulta, atualize o campo Nome como dimension_customer.

    Observação

    O Fabric adiciona um espaço e um número no final do nome da tabela por padrão. Os nomes de tabela devem ser minúsculos e não devem conter espaços. Renomeie-o adequadamente e remova todos os espaços do nome da tabela.

    Captura de tela do painel de configurações de consulta, mostrando onde inserir o nome e selecionar o destino dos dados.

  2. Neste tutorial, você associou os dados do cliente a um lakehouse. Se você criar um fluxo de dados do lakehouse, os dados carregados serão automaticamente vinculados ao lakehouse padrão. Se você estiver criando o fluxo de dados separadamente, opcionalmente poderá associá-lo a um lakehouse seguindo estas etapas:

    1. Nos itens de menu, selecione Adicionar destino de dados e selecione Lakehouse. Na tela Conectar-se ao destino de dados , entre em sua conta, se necessário, e selecione Avançar.

    2. Navegue até o wwilakehouse em seu workspace.

    3. Se a tabela dimension_customer não existir, selecione a configuração Nova tabela e insira o nome da tabela dimension_customer. Se a tabela já existir, selecione a configuração Tabela existente e escolha dimension_customer na lista de tabelas no pesquisador de objetos. Selecione Avançar.

      Captura de tela mostrando como escolher a tabela de destino.

    4. No painel Escolher configurações de destino , selecione Substituir como Método de atualização. Selecione Salvar configurações para retornar à tela de fluxo de dados.

  3. Na tela de fluxo de dados, você pode transformar facilmente os dados com base em seus requisitos de negócios. Para simplificar, não estamos fazendo nenhuma alteração neste tutorial. Para continuar, selecione Salvar e Executar na barra de ferramentas.

    Captura de tela do painel de configuração de consulta que contém o botão Publicar.

  4. Retorne ao seu workspace e passe o mouse sobre o fluxo de dados Dados da Dimensão do Cliente, selecione o menu ... e depois selecione Atualizar agora. Essa opção executa o fluxo de dados e move os dados do arquivo de origem para a tabela do lakehouse. Enquanto ele estiver em andamento, você verá um círculo giratório ao lado do nome do fluxo de dados.

    Captura de tela mostrando onde localizar o ícone Atualizar agora.

  5. Depois que o fluxo de dados for atualizado, selecione o seu lakehouse na barra de menus superior para exibir a tabela Delta dimension_customer.

    Captura de tela do painel de navegação a partir do qual a lakehouse é aberta.

  6. Selecione a tabela para visualizar seus dados. Você também pode usar o ponto de extremidade de análise do SQL do lakehouse para consultar os dados com instruções SQL. Selecione Ponto de extremidade de análise SQL no menu suspenso Lakehouse no canto superior direito da tela.

    Captura de tela da tabela delta, mostrando onde selecionar o ponto de extremidade de análise SQL.

  7. Selecione a tabela dimension_customer para visualizar seus dados ou selecione Nova consulta SQL para gravar suas instruções SQL.

    Captura de tela da interface do ponto de extremidade de análise SQL, mostrando onde selecionar Nova consulta SQL.

  8. A consulta de exemplo a seguir agrega a contagem de linhas com base na coluna BuyingGroup da tabela dimension_customer . Os arquivos de consulta SQL são salvos automaticamente para referência futura e você pode renomear ou excluir esses arquivos com base em sua necessidade.

    Para executar o script, selecione o ícone Executar na parte superior do arquivo de script.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Adicionar tabelas ao modelo semântico

Nesta seção, você adicionará as tabelas ao modelo semântico para que você possa usá-las para criar relatórios.

  1. Abra o lakehouse e alterne para a visualização do endpoint de análise SQL, selecione Novo modelo semântico, nomeie o modelo semântico, atribua um workspace e selecione as tabelas para adicionar ao modelo semântico. Nesse caso, selecione a tabela dimension_customer.

    Captura de tela em que você pode selecionar as tabelas a serem adicionadas ao modelo semântico.

Criar um relatório

Nesta seção, você criará um relatório com base nos dados ingeridos.

  1. Selecione o modelo semântico em seu workspace, selecione a lista suspensa Explorar esses dados e selecione Criar automaticamente um relatório. No próximo tutorial, criamos um relatório do zero.

    Captura de tela da página de detalhes do modelo semântico, mostrando onde selecionar Criar um relatório.

  2. A tabela é uma dimensão e não há medidas nela. O Power BI cria uma medida para a contagem de linhas, agrega-a entre diferentes colunas e cria gráficos diferentes, conforme mostrado na imagem a seguir.

    Captura de tela de uma página de resumo rápido exibindo quatro gráficos de barras diferentes.

  3. Você pode salvar este relatório para o futuro selecionando Salvar na faixa de opções superior. Você pode fazer mais alterações neste relatório para atender aos seus requisitos, incluindo ou excluindo outras tabelas ou colunas.

Próxima etapa