Compartilhar via


Carregar dados em seu armazém de dados usando pipelines

Aplica-se a:✅Warehouse no Microsoft Fabric

Neste artigo, você aprenderá a usar a atividade de cópia em pipelines do Data Factory.

  • Os pipelines oferecem uma alternativa ao uso do comando COPY através de uma interface gráfica de usuário.
  • Um pipeline é um agrupamento lógico de atividades que, juntos, executam uma tarefa de ingestão de dados.
  • Os pipelines permitem que você gerencie todas as atividades de ETL (extração, transformação e carregamento) em um só lugar, em vez de gerenciar cada uma individualmente.

Observação

Alguns recursos do Azure Data Factory não estão disponíveis no Microsoft Fabric. No entanto, os conceitos são intercambiáveis. Você pode saber mais sobre o Azure Data Factory e pipelines em Pipelines e atividades no Azure Data Factory e no Azure Synapse Analytics. Para obter um início rápido, consulte Início Rápido: Criar seu primeiro pipeline para copiar dados.

Criar um trabalho de cópia

Para criar um novo trabalho de cópia, siga estas etapas.

  1. Na tela inicial do workspace, selecione o botão + Novo item . Na seção Obter dados , selecione Copiar trabalho.

  2. Na caixa de diálogo Novo trabalho de cópia , insira um nome para o novo pipeline e selecione Criar. A nova janela Copiar tarefa abre.

  3. Escolha sua fonte de dados no catálogo do OneLake.

  4. Na página Escolher dados , visualize o conjunto de dados selecionado. Depois de examinar os dados, selecione Avançar.

  5. Na página Escolher destino de dados , selecione o warehouse desejado no catálogo do OneLake.

  6. A página Escolher o modo de trabalho de cópia permite que você configure como deseja que os dados sejam copiados: uma cópia completa ou cópias incrementais que executam apenas cópias subsequentes quando os dados de origem são alterados.

    Por enquanto, selecione Cópia completa. Para outras fontes de dados e cenários, você pode carregar dados incrementalmente conforme a fonte de dados é atualizada.

  7. Você pode ajustar as tabelas de destino com o nome do esquema de destino desejado e o nome da tabela. Forneça nomes de esquema e tabela que correspondam à convenção de nomenclatura desejada. Quando terminar de fazer alterações, selecione Avançar.

    Captura de tela do Mapa para a página de destino da janela de trabalho de cópia. O destino é dbo.NYC_taxi.

  8. Opcionalmente, para modificar os mapeamentos de coluna, selecione Editar mapeamento de coluna. Você pode mapear nomes de coluna de origem para novos nomes, tipos de dados ou ignorar colunas de coluna de origem.

    Captura de tela mostrando as opções para carregar dados em uma tabela existente ou criar uma nova.

    Quando terminar de revisar os mapeamentos de coluna, selecione Avançar.

  9. A página Revisar + salvar é um resumo do novo trabalho de Cópia.

    Examine o resumo e as opções e selecione Salvar + Executar.

  10. Você é direcionado para a área de tela do pipeline, em que uma nova atividade de trabalho de Cópia com sua Origem e Destino já está configurada para você. Se você selecionou Iniciar transferência de dados imediatamente na página anterior, o trabalho de cópia será iniciado assim que estiver pronto para ser executado.

  11. Você pode monitorar o status do pipeline no painel Resultados .

  12. Após alguns segundos, o pipeline será concluído com sucesso. Ao navegar de volta para o seu armazém, você pode selecionar sua tabela para visualizar os dados e confirmar se a operação de cópia foi concluída.

Próxima etapa

Opções de ingestão de dados

Outras maneiras de ingerir dados em seu warehouse incluem: