Transformieren von Daten mit Spark in Azure Synapse Analytics

Modul
7 Einheiten

Fortgeschrittene Anfänger

Technische Fachkraft für Daten

Azure Synapse Analytics

Technische Fachkräfte für Daten müssen in der Regel große Datenmengen transformieren. Apache Spark-Pools in Azure Synapse Analytics bieten eine verteilte Verarbeitungsplattform, mit der sie dieses Ziel erreichen können.

Lernziele

In diesem Modul erfahren Sie, wie Sie:

Verwenden von Apache Spark zum Ändern und Speichern von Datenframes
Partitionieren Sie Datendateien für verbesserte Leistung und Skalierbarkeit.
Transformieren von Daten mit SQL

Voraussetzungen

Bevor Sie dieses Modul verwenden, sollten Sie mit Apache Spark-Pools in Azure Synapse Analytics vertraut sein. Erwägen Sie zunächst, das Modul Analyse von Daten mit Apache Spark in Azure Synapse Analytics abzuschließen.

Einleitung min
Ändern und Speichern von Datenframes min
Partitionieren von Datendateien min
Transformieren von Daten mit SQL min
Übung: Transformieren von Daten mit Spark in Azure Synapse Analytics min
Modulbewertung min
Zusammenfassung min

Start