Partilhar via


Migrar o Azure Data Lake Analytics para o Azure Synapse Analytics

O Azure Data Lake Analytics será desativado em 29 de fevereiro de 2024. Saiba mais com este anúncio.

Se já estiver a utilizar o Azure Data Lake Analytics, pode criar um plano de migração para o Azure Synapse Analytics para a sua organização.

A Microsoft lançou o Azure Synapse Analytics que visa reunir lagos de dados e armazéns de dados para proporcionar uma experiência única em análises de grandes volumes de dados. Ele irá ajudá-lo a reunir e analisar seus dados para resolver a ineficiência de dados e ajudar suas equipes a trabalhar juntas. Além disso, a integração da Synapse com o Azure Machine Learning e o Power BI permitirá que as organizações obtenham insights de seus dados e executem aprendizado de máquina para todos os seus aplicativos inteligentes.

O documento mostra como fazer a migração do Azure Data Lake Analytics para o Azure Synapse Analytics.

  • Etapa 1: Avaliar a prontidão
  • Etapa 2: Preparar para migrar
  • Etapa 3: Migrar dados e cargas de trabalho de aplicativos
  • Etapa 4: Transferência do Azure Data Lake Analytics para o Azure Synapse Analytics

Etapa 1: Avaliar a prontidão

  1. Veja o Apache Spark no Azure Synapse Analytics e entenda as principais diferenças do Azure Data Lake Analytics e do Spark no Azure Synapse Analytics.

    Artigo Azure Data Lake Analytics Faísca na Sinapse
    Preços Por unidade-hora analítica Por vCore-hora
    Motores Azure Data Lake Analytics Apache Spark
    Linguagem de programação padrão U-SQL T-SQL, Python, Scala, Spark SQL e .NET
    Fontes de dados Armazenamento Azure Data Lake Armazenamento de Blobs do Azure, Armazenamento do Azure Data Lake
  2. Reveja o Questionário para Avaliação da Migração e enumere os possíveis riscos a considerar.

Etapa 2: Preparar para migrar

  1. Identifique as tarefas e dados que irá migrar.

    • Aproveite esta oportunidade para eliminar as tarefas que já não utiliza. A menos que você planeje migrar todos os seus trabalhos de uma só vez, reserve esse tempo para identificar grupos lógicos de trabalhos que você pode migrar em fases.
    • Avalie o tamanho dos dados e entenda o formato de dados do Apache Spark. Revise seus scripts U-SQL e avalie os esforços de reescrita de scripts e entenda o conceito de código do Apache Spark.
  2. Determine o impacto que uma migração terá no seu negócio. Por exemplo, se você pode arcar com qualquer tempo de inatividade durante a migração.

  3. Crie um plano de migração.

Etapa 3: Migrar dados e carga de trabalho de aplicativos

  1. Migre seus dados do Azure Data Lake Storage Gen1 para o Azure Data Lake Storage Gen2.

    A desativação do Azure Data Lake Storage Gen1 será em fevereiro de 2024, veja o anúncio oficial. Sugerimos migrar os dados para o Gen2 em primeiro lugar. Consulte Compreender os formatos de dados do Apache Spark para desenvolvedores U-SQL do Azure Data Lake Analytics e mova o arquivo e os dados armazenados em tabelas U-SQL para torná-los acessíveis ao Azure Synapse Analytics. Mais detalhes sobre o guia de migração podem ser encontrados aqui.

  2. Transforme seus scripts U-SQL em Spark. Consulte Compreender os conceitos de código do Apache Spark para desenvolvedores U-SQL do Azure Data Lake Analytics para transformar seus scripts U-SQL em Spark.

  3. Transforme ou recrie os seus pipelines de orquestração de tarefas para o novo programa Spark.

Etapa 4: Passar do Azure Data Lake Analytics para o Azure Synapse Analytics

Depois de ter certeza de que seus aplicativos e cargas de trabalho são estáveis, você pode começar a usar o Azure Synapse Analytics para satisfazer seus cenários de negócios. Desative todos os pipelines restantes que estão sendo executados no Azure Data Lake Analytics e desative suas contas do Azure Data Lake Analytics.

Questionário para Avaliação da Migração

Categoria Perguntas Referência
Avaliar o tamanho da migração Quantas contas do Azure Data Lake Analytics você tem? Quantos gasodutos estão em uso? Quantos scripts U-SQL estão em uso? Quanto mais dados e scripts forem migrados e mais UDO/UDF forem usados, mais difícil será a migração. O tempo e os recursos necessários para a migração precisam ser bem planejados de acordo com a escala do projeto.
Fonte de dados Qual é o tamanho da fonte de dados? Que tipos de formato de dados para processamento? Compreender os formatos de dados do Apache Spark para desenvolvedores U-SQL do Azure Data Lake Analytics
Saída de dados Você manterá os dados de saída para uso posterior? Se os dados de saída são salvos em tabelas U-SQL, como lidar com isso? Se os dados de saída forem usados com frequência e salvos em tabelas U-SQL, você precisará alterar os scripts e alterar os dados de saída para o formato de dados suportado pelo Spark.
Migração de dados Você fez o plano de migração de armazenamento? Migrar o Armazenamento do Azure Data Lake de Gen1 para Gen2
Transformação de scripts U-SQL Você usa UDO/UDF (.NET, python, etc.)? Se a resposta acima for sim, qual linguagem você usa em seu UDO/UDF e quaisquer problemas para a transformação durante a transformação? A consulta federada está sendo usada no U-SQL? Compreender os conceitos de código do Apache Spark para desenvolvedores U-SQL do Azure Data Lake Analytics

Próximos passos