Transformer des données avec Spark dans Azure Synapse Analytics

Module
7 Unités

Intermédiaire

Ingénieur Data

Azure Synapse Analytics

Les ingénieurs Données doivent généralement transformer de gros volumes de données. Les pools Apache Spark dans Azure Synapse Analytics fournissent une plateforme de traitement distribué qui leur permet d’atteindre cet objectif.

Objectifs d’apprentissage

Dans ce module, vous allez découvrir comment :

Utiliser Apache Spark pour modifier et enregistrer des trames de données
Partitionner des fichiers de données pour améliorer les performances et l’extensibilité.
Transformer des données avec SQL

Prérequis

Avant de prendre ce module, vous devez être familiarisé avec les pools Apache Spark dans Azure Synapse Analytics. Envisagez d'abord de terminer le module Analyser des données avec Apache Spark dans Azure Synapse Analytics.

Présentation min
Modifier et enregistrer des trames de données min
Partitionner des fichiers de données min
Transformer des données avec SQL min
Exercice : Transformer des données avec Spark dans Azure Synapse Analytics min
Évaluation du module min
Résumé min

Démarrer