Transformieren von Daten mit Spark in Azure Synapse Analytics

Fortgeschrittene Anfänger
Technische Fachkraft für Daten
Azure Synapse Analytics

Technische Fachkräfte für Daten müssen in der Regel große Datenmengen transformieren. Apache Spark-Pools in Azure Synapse Analytics bieten eine verteilte Verarbeitungsplattform, mit der sie dieses Ziel erreichen können.

Lernziele

In diesem Modul erfahren Sie, wie Sie:

  • Verwenden von Apache Spark zum Ändern und Speichern von Datenframes
  • Partitionieren Sie Datendateien für verbesserte Leistung und Skalierbarkeit.
  • Transformieren von Daten mit SQL

Voraussetzungen

Bevor Sie dieses Modul verwenden, sollten Sie mit Apache Spark-Pools in Azure Synapse Analytics vertraut sein. Erwägen Sie zunächst, das Modul Analyse von Daten mit Apache Spark in Azure Synapse Analytics abzuschließen.