Partilhar via


Tutorial Lakehouse: Criar uma lakehouse, ingerir dados de amostra e criar um relatório

Neste tutorial, você cria uma casa de lago, ingere dados de amostra na tabela Delta, aplica transformação quando necessário e, em seguida, cria relatórios. Aqui está uma lista de verificação das etapas concluídas:

Se você não tiver o Microsoft Fabric, inscreva-se para obter uma capacidade de avaliação gratuita.

Pré-requisitos

Por que preciso do OneDrive para este tutorial?

Você precisa do OneDrive para este tutorial porque o processo de ingestão de dados depende do OneDrive como o mecanismo de armazenamento subjacente para carregamentos de arquivos. Quando você carrega um arquivo CSV no Fabric, ele é armazenado temporariamente em sua conta do OneDrive antes de ser ingerido na casa do lago. Essa integração garante uma transferência de arquivos segura e perfeita dentro do ecossistema do Microsoft 365.

A etapa de ingestão não funcionará se você não tiver o OneDrive configurado, porque o Fabric não pode acessar o arquivo carregado. Se você já tiver os dados disponíveis em sua casa do lago ou em outro local compatível, o OneDrive não será necessário.

Nota

Se já tens dados no teu lakehouse, podes usá-los em vez do ficheiro CSV de exemplo. Para verificar se os dados já estão associados à sua lakehouse, use o Lakehouse Explorer ou o endpoint de análise SQL para procurar tabelas, ficheiros e pastas. Para obter mais informações sobre como verificar, consulte Lakehouse: visão geral e Consultar tabelas do Lakehouse com o terminal de análise SQL.

Criar uma casa no lago

Nesta seção, você cria uma casa de lago no Fabric.

  1. No Fabric, selecione Workspaces na barra de navegação.

  2. Para abrir seu espaço de trabalho, digite seu nome na caixa de pesquisa localizada na parte superior e selecione-o nos resultados da pesquisa.

  3. No espaço de trabalho, selecione Novo item, digite Lakehouse na caixa de pesquisa e selecione Lakehouse.

  4. Na caixa de diálogo New lakehouse, digite wwilakehouse no campo Nome.

    Captura de tela da caixa de diálogo New lakehouse.

  5. Selecione Criar para criar e abrir a nova casa do lago.

Ingerir dados de exemplo

Nesta seção, você ingere dados de amostra do cliente na casa do lago.

Nota

Se não tiver o OneDrive configurado, inscreva-se na versão de avaliação gratuita do Microsoft 365: Avaliação gratuita - Experimente o Microsoft 365 durante um mês.

  1. Baixe o arquivo de dimension_customer.csv do repositório de amostras de malha.

  2. Na guia Página Inicial, em Obter dados em sua casa do lago, você verá opções para carregar dados na casa do lago. Selecione New Dataflow Gen2.

    Captura de tela mostrando onde selecionar a opção New Dataflow Gen2 para carregar dados em sua casa do lago.

  3. No painel Criar um fluxo de dados , insira Dados da Dimensão do Cliente no campo Nome e selecione Avançar.

    Captura de tela do painel Criar um fluxo de dados, mostrando onde inserir o nome do fluxo de dados.

  4. Na nova tela de fluxo de dados, selecione Importar de um arquivo de texto/CSV.

  5. Na tela Conectar à fonte de dados, selecione o botão de opção Carregar arquivo. Arraste e solte o arquivo dimension_customer.csv que você baixou na etapa 1. Depois que o arquivo for carregado, selecione Avançar.

    Captura de tela mostrando onde selecionar Carregar arquivo e para onde arrastar o arquivo baixado anteriormente.

  6. Na página Visualizar dados do arquivo, visualize os dados e selecione Criar para continuar e retornar à tela de fluxo de dados.

Transforme e carregue dados no lakehouse

Nesta seção, você transforma os dados com base em seus requisitos de negócios e os carrega no lakehouse.

  1. No painel Configurações de consulta , atualize o campo Nome para dimension_customer.

    Nota

    A malha adiciona um espaço e um número no final do nome da tabela por padrão. Os nomes das tabelas devem ser minúsculos e não devem conter espaços. Renomeie-o adequadamente e remova todos os espaços do nome da tabela.

    Captura de ecrã do painel de definições de consulta, mostrando onde introduzir o nome e selecionar o destino dos dados.

  2. Neste tutorial, você associou os dados do cliente a uma casa de lago. Se você criar um fluxo de dados a partir da lakehouse, os dados carregados serão automaticamente vinculados à lakehouse padrão. Se você estiver criando o fluxo de dados separadamente, poderá associá-lo opcionalmente a uma casa de lago seguindo estas etapas:

    1. Nos itens de menu, selecione Adicionar destino de dados e selecione Lakehouse. Na tela Conectar ao destino dos dados , entre na sua conta, se necessário, e selecione Avançar.

    2. Navegue até a wwilakehouse em seu espaço de trabalho.

    3. Se a tabela dimension_customer não existir, selecione a configuração Nova tabela e insira o nome da tabela dimension_customer. Se a tabela já existir, selecione a configuração Tabela existente e escolha dimension_customer na lista de tabelas no pesquisador de objetos. Selecione Seguinte.

      Captura de ecrã a mostrar como escolher a tabela de destino.

    4. No painel Escolher configurações de destino, selecione Substituir como método de atualização. Selecione Salvar configurações para retornar à tela de fluxo de dados.

  3. A partir da tela de fluxo de dados, você pode facilmente transformar os dados com base em seus requisitos de negócios. Para simplificar, não estamos fazendo nenhuma alteração neste tutorial. Para continuar, selecione Salvar e Executar na barra de ferramentas.

    Captura de ecrã do painel de definições da consulta que contém o botão Publicar.

  4. Retorne ao seu espaço de trabalho e passe o mouse sobre o fluxo de dados do Customer Dimension Data , selecione o menu ... e selecione Atualizar agora. Esta opção executa o fluxo de dados e move os dados do arquivo de origem para a tabela lakehouse. Enquanto ele está em andamento, você vê um círculo giratório ao lado do nome do fluxo de dados.

    Captura de ecrã a mostrar onde encontrar o ícone Atualizar agora.

  5. Depois que o fluxo de dados for atualizado, selecione sua casa do lago na barra de menu superior para visualizar a tabela Delta dimension_customer .

    Captura de tela do painel de navegação a partir do qual a casa do lago é aberta.

  6. Selecione a tabela para visualizar seus dados. Você também pode usar o ponto de extremidade de análise SQL do lakehouse para consultar os dados com instruções SQL. Selecione o ponto de extremidade de análise SQL no menu suspenso de Lakehouse no canto superior direito da tela.

    Captura de tela da tabela Delta, mostrando onde selecionar o ponto de extremidade de análise SQL.

  7. Selecione a tabela dimension_customer para visualizar seus dados ou selecione Nova consulta SQL para escrever suas instruções SQL.

    Captura de ecrã do endpoint de análises SQL, mostrando a localização para selecionar Nova Consulta SQL.

  8. A consulta de exemplo a seguir agrega a contagem de linhas com base na coluna BuyingGroup da tabela dimension_customer . Os arquivos de consulta SQL são salvos automaticamente para referência futura, e você pode renomear ou excluir esses arquivos com base em sua necessidade.

    Para executar o script, selecione o ícone Executar na parte superior do arquivo de script.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Adicionar tabelas ao modelo semântico

Nesta seção, você adiciona as tabelas ao modelo semântico para que possa usá-las para criar relatórios.

  1. Abra o lakehouse e mude para a vista do endpoint de análises SQL, selecione Novo modelo semântico, nomeie o modelo semântico, associe um espaço de trabalho e selecione as tabelas que pretende adicionar ao modelo semântico. Nesse caso, selecione a tabela dimension_customer .

    Captura de tela onde você pode selecionar as tabelas a serem adicionadas ao modelo semântico.

Criar um relatório

Nesta seção, você cria um relatório a partir dos dados ingeridos.

  1. Selecione o modelo semântico em seu espaço de trabalho, selecione a lista suspensa Explore esses dados e selecione Criar automaticamente um relatório. No próximo tutorial, criamos um relatório do zero.

    Captura de tela da página de detalhes do modelo semântico, mostrando onde selecionar Criar um relatório.

  2. A tabela é uma dimensão e não há medidas nela. O Power BI cria uma medida para a contagem de linhas, agrega-a em colunas diferentes e cria gráficos diferentes, conforme mostrado na imagem a seguir.

    Captura de ecrã de uma página de resumo rápido que apresenta quatro gráficos de barras diferentes.

  3. Você pode salvar este relatório para o futuro selecionando Salvar na faixa de opções superior. Você pode fazer mais alterações neste relatório para atender às suas necessidades, incluindo ou excluindo outras tabelas ou colunas.

Próximo passo