Utiliser Apache Spark dans Microsoft Fabric

Intermédiaire
Analyste de données
Ingénieur Data
Microsoft Fabric

Apache Spark est une technologie de base pour l’analytique des données à grande échelle. Microsoft Fabric fournit une prise en charge pour les clusters Spark, ce qui vous permet d’analyser et de traiter des données dans un stockage de données à grande échelle.

Objectifs d’apprentissage

Dans ce module, vous allez découvrir comment :

  • Configurer Spark dans un espace de travail Microsoft Fabric.

  • Identifier les scénarios appropriés pour les notebooks Spark et les travaux Spark

  • Utiliser des dataframes Spark pour analyser et transformer des données.

  • Utiliser Spark SQL pour interroger des données dans des tables et des vues.

  • Visualiser des données dans un notebook Spark

Prérequis

Avant de commencer ce module, vous devez vous familiariser avec l’interface Microsoft Fabric et les concepts de base.