Transformer des données avec Spark dans Azure Synapse Analytics
Intermédiaire
Ingénieur Data
Azure Synapse Analytics
Les ingénieurs Données doivent généralement transformer de gros volumes de données. Les pools Apache Spark dans Azure Synapse Analytics fournissent une plateforme de traitement distribué qui leur permet d’atteindre cet objectif.
Objectifs d’apprentissage
Dans ce module, vous allez découvrir comment :
- Utiliser Apache Spark pour modifier et enregistrer des trames de données
- Partitionner des fichiers de données pour améliorer les performances et l’extensibilité.
- Transformer des données avec SQL
Prérequis
Avant de prendre ce module, vous devez être familiarisé avec les pools Apache Spark dans Azure Synapse Analytics. Envisagez d'abord de terminer le module Analyser des données avec Apache Spark dans Azure Synapse Analytics.