Transformación de datos con Spark en Azure Synapse Analytics
Intermedio
Ingeniero de datos
Azure Synapse Analytics
Normalmente, los ingenieros de datos necesitan transformar grandes volúmenes de datos. Los grupos de Apache Spark de Azure Synapse Analytics proporcionan una plataforma de procesamiento distribuido que pueden usar para lograr este objetivo.
Objetivos de aprendizaje
En este módulo, aprenderás a:
- Uso de Apache Spark para modificar y guardar tramas de datos
- Cree particiones de archivos de datos para mejorar el rendimiento y la escalabilidad.
- Transformación de datos con SQL
Requisitos previos
Antes de realizar este módulo, debe estar familiarizado con los grupos de Apache Spark en Azure Synapse Analytics. Considere completar primero el módulo Analizar datos con Apache Spark en Azure Synapse Analytics.