Compartilhar via


Início Rápido: Ingerir dados usando o Azure Synapse Pipelines (versão prévia)

Importante

O Azure Synapse Analytics Data Explorer (versão prévia) será desativado em 7 de outubro de 2025. Após essa data, as cargas de trabalho em execução no Synapse Data Explorer serão excluídas e os dados do aplicativo associado serão perdidos. É altamente recomendável migrar para o Eventhouse no Microsoft Fabric.

O programa CMF (Microsoft Cloud Migration Factory) foi projetado para ajudar os clientes na migração para o Fabric. O programa oferece recursos práticos de teclado sem custo para o cliente. Esses recursos são atribuídos por um período de 6 a 8 semanas, com um escopo predefinido e acordado. As nomeações de clientes são aceitas da equipe de conta da Microsoft ou diretamente enviando uma solicitação de ajuda à equipe do CMF.

Neste início rápido, você aprenderá a carregar dados de uma fonte de dados no pool do Azure Synapse Data Explorer.

Pré-requisitos

  • Uma assinatura do Azure. Criar uma conta gratuita do Azure.

  • Criar um pool do Data Explorer usando o Synapse Studio ou o portal do Azure

  • Criar um banco de dados do Data Explorer.

    1. No Synapse Studio, no painel esquerdo, selecione Dados.

    2. Selecione + (Adicionar novo recurso) >Pool do Data Explorer e use as seguintes informações:

      Configurações Valor sugerido Description
      Nome da piscina contosodataexplorer O nome do pool do Data Explorer que será utilizado
      Nome TestDatabase O nome do banco de dados deve ser exclusivo dentro do cluster.
      Período de retenção padrão 365 O período de tempo (em dias) durante o qual há a garantia de que os dados serão mantidos disponíveis para consulta. O intervalo de tempo é medido a partir do momento em que os dados são ingeridos.
      Período de cache padrão 31 O período de tempo (em dias) durante o qual os dados consultados com frequência devem ser mantidos disponíveis no armazenamento SSD ou RAM, em vez de no armazenamento de longo prazo.
    3. Selecione Criar para criar o banco de dados. A criação geralmente leva menos de um minuto.

  • Criar uma tabela

    1. No Synapse Studio, no painel do lado esquerdo, selecione Desenvolver.
    2. Em Scripts KQL, selecione + (Adicionar novo recurso) >Script KQL. No painel do lado direito, você pode nomear o script.
    3. No menu Conexão, selecione contosodataexplorer.
    4. No menu Usar banco de dados, selecione TestDatabase.
    5. Cole o comando a seguir e selecione Executar para criar uma tabela.
    .create table StormEvents (StartTime: datetime, EndTime: datetime, EpisodeId: int, EventId: int, State: string, EventType: string, InjuriesDirect: int, InjuriesIndirect: int, DeathsDirect: int, DeathsIndirect: int, DamageProperty: int, DamageCrops: int, Source: string, BeginLocation: string, EndLocation: string, BeginLat: real, BeginLon: real, EndLat: real, EndLon: real, EpisodeNarrative: string, EventNarrative: string, StormSummary: dynamic)
    

    Dica

    Verifique se a tabela foi criada com êxito. No painel esquerdo, selecione Dados, selecione o menu contosodataexplorer e, em seguida, selecione Atualizar. Em contosodataexplorer, expanda Tabelas e verifique se a tabela StormEvents é exibida na lista.

  • Obtenha os endpoints de Consulta e Ingestão de Dados. Você precisará do endpoint de consulta para configurar seu serviço vinculado.

    1. No Synapse Studio, no painel do lado esquerdo, selecione Gerenciar>Pools do Data Explorer.

    2. Selecione o pool do Data Explorer que você deseja usar para exibir seus detalhes.

      Captura de tela da tela

    3. Anote os endpoints de Consulta e Ingestão de Dados. Use o endpoint de consulta como cluster ao configurar conexões com o pool do Data Explorer. Ao configurar SDKs para ingestão de dados, use o endpoint de ingestão de dados.

      Captura de tela do painel de propriedades de pools do Data Explorer, mostrando os endereços URI de Consulta e Ingestão de Dados.

Criar um serviço vinculado

No Azure Synapse Analytics, um serviço vinculado é onde você define suas informações de conexão com outros serviços. Nesta seção, você criará um serviço vinculado para o Azure Data Explorer.

  1. No Synapse Studio, no painel esquerdo, selecione Gerenciar>serviços vinculados.

  2. Selecione + Novo.

    Captura de tela da tela Serviços vinculados, mostrando a lista de serviços existentes e realçando o botão adicionar novo.

  3. Selecione o serviço Azure Data Explorer na galeria e selecione Continuar.

    Captura de tela do novo painel Serviços vinculados, mostrando a lista de serviços disponíveis e realçando a adição do novo serviço do Azure Data Explorer.

  4. Na página Novo Serviço Vinculado, insira as informações a seguir:

    Configurações Valor sugerido Description
    Nome contosodataexplorerlinkedservice O nome do novo serviço vinculado do Azure Data Explorer.
    Método de autenticação Identidade Gerenciada O método de autenticação para o novo serviço.
    Método de seleção de conta Insira manualmente O método para especificar o endpoint de consulta.
    Ponto final https://contosodataexplorer.contosoanalytics.dev.kusto.windows.net O ponto de extremidade consulta que você anotou anteriormente.
    Base de dados TestDatabase O banco de dados no qual você deseja ingerir dados.

    Captura de tela do novo painel de detalhes dos serviços vinculados, mostrando os campos que precisam ser concluídos para o novo serviço.

  5. Selecione Testar conectividade para validar as configurações e escolha Criar.

Criar um pipeline para ingerir dados

Um pipeline contém o fluxo lógico para uma execução de um conjunto de atividades. Nesta seção, você criará um pipeline que contém uma atividade de cópia que ingere dados de sua fonte preferencial em um pool do Data Explorer.

  1. No Synapse Studio, no painel esquerdo, selecione Integrar.

  2. Selecione +>Pipeline. No painel do lado direito, você pode nomear o pipeline.

    Captura de tela mostrando a seleção para criar um novo pipeline.

  3. Em Atividades>Mover e Transformar, arraste Copiar dados na tela do pipeline.

  4. Selecione a atividade de cópia e vá para a guia Origem . Selecione ou crie um novo conjunto de dados de origem como a origem da qual copiar dados.

  5. Vá para a guia Coletor . Selecione Novo para criar um novo conjunto de dados do coletor.

    Captura de tela da atividade de cópia de pipeline mostrando a seleção para criar um coletor.

  6. Selecione o conjunto de dados do Azure Data Explorer na galeria e selecione Continuar.

  7. No painel Definir propriedades , use as informações a seguir e selecione OK.

    Configurações Valor sugerido Description
    Nome AzureDataExplorerTable O nome do novo pipeline.
    Serviço vinculado contosodataexplorerlinkedservice O serviço vinculado que você criou anteriormente.
    Table StormEvents A tabela que você criou anteriormente.

    Captura de tela do painel de propriedades do conjunto de atividades de cópia do pipeline, mostrando os campos que precisam ser concluídos para o novo coletor.

  8. Para validar o pipeline, selecione Validar na barra de ferramentas. Você verá o resultado da saída de validação do Pipeline no lado direito da página.

Depurar e publicar o pipeline

Depois de concluir a configuração do pipeline, você pode executar uma execução de depuração antes de publicar seus artefatos para verificar se tudo está correto.

  1. Selecione Depurar na barra de ferramentas. Você verá o status da execução do pipeline na guia Saída na parte inferior da janela.

  2. Depois que a execução do pipeline for bem-sucedida, na barra de ferramentas superior, selecione Publicar tudo. Essa ação publica entidades (conjuntos de dados e pipelines) que você criou para o serviço do Synapse Analytics.

  3. Aguarde até que você veja a mensagem Publicado com êxito. Para ver as mensagens de notificação, selecione o botão de sino no canto superior direito.

Acionar e monitorar o pipeline

Nesta seção, você aciona manualmente o pipeline publicado na etapa anterior.

  1. Selecione Adicionar gatilho na barra de ferramentas e, em seguida, selecione Acionar Agora. Na página Execução de pipeline, selecione OK.

  2. Vá para a guia Monitor localizada na barra lateral esquerda. Você verá uma execução do pipeline que é disparada por um gatilho manual.

  3. Quando a execução do pipeline for concluída com êxito, selecione o link na coluna nome do pipeline para exibir os detalhes da execução da atividade ou executar novamente o pipeline. Neste exemplo, há apenas uma atividade, então você vê apenas uma entrada na lista.

  4. Para obter detalhes sobre a operação de cópia, selecione o link Detalhes (ícone de óculos) na coluna Nome de atividade. Você pode monitorar detalhes como o volume de dados copiados da fonte para o coletor, taxa de transferência de dados, etapas de execução com duração correspondente e configurações usadas.

  5. Para voltar à exibição de execuções de pipeline, selecione o link Todos os pipelines são executados na parte superior. Selecione Atualizar para atualizar a lista.

  6. Verifique se os dados foram gravados corretamente no pool do Data Explorer.

Próximas etapas