Transformieren von Daten mit Spark in Azure Synapse Analytics
Fortgeschrittene Anfänger
Technische Fachkraft für Daten
Azure Synapse Analytics
Technische Fachkräfte für Daten müssen in der Regel große Datenmengen transformieren. Apache Spark-Pools in Azure Synapse Analytics bieten eine verteilte Verarbeitungsplattform, mit der sie dieses Ziel erreichen können.
Lernziele
In diesem Modul erfahren Sie, wie Sie:
- Verwenden von Apache Spark zum Ändern und Speichern von Datenframes
- Partitionieren Sie Datendateien für verbesserte Leistung und Skalierbarkeit.
- Transformieren von Daten mit SQL
Voraussetzungen
Bevor Sie dieses Modul verwenden, sollten Sie mit Apache Spark-Pools in Azure Synapse Analytics vertraut sein. Erwägen Sie zunächst, das Modul Analyse von Daten mit Apache Spark in Azure Synapse Analytics abzuschließen.