Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
O Azure Data Lake Analytics será desativado em 29 de fevereiro de 2024. Saiba mais com este anúncio.
Se já estiver a utilizar o Azure Data Lake Analytics, pode criar um plano de migração para o Azure Synapse Analytics para a sua organização.
A Microsoft lançou o Azure Synapse Analytics que visa reunir lagos de dados e armazéns de dados para proporcionar uma experiência única em análises de grandes volumes de dados. Ele irá ajudá-lo a reunir e analisar seus dados para resolver a ineficiência de dados e ajudar suas equipes a trabalhar juntas. Além disso, a integração da Synapse com o Azure Machine Learning e o Power BI permitirá que as organizações obtenham insights de seus dados e executem aprendizado de máquina para todos os seus aplicativos inteligentes.
O documento mostra como fazer a migração do Azure Data Lake Analytics para o Azure Synapse Analytics.
Abordagem recomendada
- Etapa 1: Avaliar a prontidão
- Etapa 2: Preparar para migrar
- Etapa 3: Migrar dados e cargas de trabalho de aplicativos
- Etapa 4: Transferência do Azure Data Lake Analytics para o Azure Synapse Analytics
Etapa 1: Avaliar a prontidão
Veja o Apache Spark no Azure Synapse Analytics e entenda as principais diferenças do Azure Data Lake Analytics e do Spark no Azure Synapse Analytics.
Artigo Azure Data Lake Analytics Faísca na Sinapse Preços Por unidade-hora analítica Por vCore-hora Motores Azure Data Lake Analytics Apache Spark Linguagem de programação padrão U-SQL T-SQL, Python, Scala, Spark SQL e .NET Fontes de dados Armazenamento Azure Data Lake Armazenamento de Blobs do Azure, Armazenamento do Azure Data Lake Reveja o Questionário para Avaliação da Migração e enumere os possíveis riscos a considerar.
Etapa 2: Preparar para migrar
Identifique as tarefas e dados que irá migrar.
- Aproveite esta oportunidade para eliminar as tarefas que já não utiliza. A menos que você planeje migrar todos os seus trabalhos de uma só vez, reserve esse tempo para identificar grupos lógicos de trabalhos que você pode migrar em fases.
- Avalie o tamanho dos dados e entenda o formato de dados do Apache Spark. Revise seus scripts U-SQL e avalie os esforços de reescrita de scripts e entenda o conceito de código do Apache Spark.
Determine o impacto que uma migração terá no seu negócio. Por exemplo, se você pode arcar com qualquer tempo de inatividade durante a migração.
Crie um plano de migração.
Etapa 3: Migrar dados e carga de trabalho de aplicativos
Migre seus dados do Azure Data Lake Storage Gen1 para o Azure Data Lake Storage Gen2.
A desativação do Azure Data Lake Storage Gen1 será em fevereiro de 2024, veja o anúncio oficial. Sugerimos migrar os dados para o Gen2 em primeiro lugar. Consulte Compreender os formatos de dados do Apache Spark para desenvolvedores U-SQL do Azure Data Lake Analytics e mova o arquivo e os dados armazenados em tabelas U-SQL para torná-los acessíveis ao Azure Synapse Analytics. Mais detalhes sobre o guia de migração podem ser encontrados aqui.Transforme seus scripts U-SQL em Spark. Consulte Compreender os conceitos de código do Apache Spark para desenvolvedores U-SQL do Azure Data Lake Analytics para transformar seus scripts U-SQL em Spark.
Transforme ou recrie os seus pipelines de orquestração de tarefas para o novo programa Spark.
Etapa 4: Passar do Azure Data Lake Analytics para o Azure Synapse Analytics
Depois de ter certeza de que seus aplicativos e cargas de trabalho são estáveis, você pode começar a usar o Azure Synapse Analytics para satisfazer seus cenários de negócios. Desative todos os pipelines restantes que estão sendo executados no Azure Data Lake Analytics e desative suas contas do Azure Data Lake Analytics.
Questionário para Avaliação da Migração
| Categoria | Perguntas | Referência |
|---|---|---|
| Avaliar o tamanho da migração | Quantas contas do Azure Data Lake Analytics você tem? Quantos gasodutos estão em uso? Quantos scripts U-SQL estão em uso? | Quanto mais dados e scripts forem migrados e mais UDO/UDF forem usados, mais difícil será a migração. O tempo e os recursos necessários para a migração precisam ser bem planejados de acordo com a escala do projeto. |
| Fonte de dados | Qual é o tamanho da fonte de dados? Que tipos de formato de dados para processamento? | Compreender os formatos de dados do Apache Spark para desenvolvedores U-SQL do Azure Data Lake Analytics |
| Saída de dados | Você manterá os dados de saída para uso posterior? Se os dados de saída são salvos em tabelas U-SQL, como lidar com isso? | Se os dados de saída forem usados com frequência e salvos em tabelas U-SQL, você precisará alterar os scripts e alterar os dados de saída para o formato de dados suportado pelo Spark. |
| Migração de dados | Você fez o plano de migração de armazenamento? | Migrar o Armazenamento do Azure Data Lake de Gen1 para Gen2 |
| Transformação de scripts U-SQL | Você usa UDO/UDF (.NET, python, etc.)? Se a resposta acima for sim, qual linguagem você usa em seu UDO/UDF e quaisquer problemas para a transformação durante a transformação? A consulta federada está sendo usada no U-SQL? | Compreender os conceitos de código do Apache Spark para desenvolvedores U-SQL do Azure Data Lake Analytics |