Datenrollen
Die Geschichte, die Sie mit den Daten erzählen, beginnt in der Regel nicht bei Ihnen selbst. Am Anfang steht die Datenquelle. Und diese Aufgabe liegt insbesondere in einem größeren Unternehmen wahrscheinlich nicht in Ihrem Verantwortungsbereich.
Die heutigen Anwendungen und Projekten kann groß und kompliziert sein. Sie kann zudem oft den Einsatz von Fähigkeiten und Wissen vieler Einzelpersonen beinhalten. Jede Person trägt individuelle Fähigkeiten und spezifisches Fachwissen bei. Gemeinsam werden die Aufgaben und Zuständigkeiten koordiniert, um ein Projekt von der Konzeption bis zur Produktion erfolgreich umzusetzen.
In der jüngeren Vergangenheit stellten Business Analysts und Business Intelligence-Entwickler die wichtigsten Rollen bei der Datenverarbeitung und ‑analyse dar. Das übermäßige Wachstum der Datenmenge und der verschiedenen Datentypen hat jedoch dazu geführt, dass diese Rollen weiter entwickelt und spezialisiert wurden. Dadurch konnten die Datentechnik und ‑analyse noch einmal modernisiert und optimiert werden.
In den folgenden Abschnitten werden diese unterschiedlichen Datenrollen mit ihren jeweiligen Aufgaben im Bereich der Datenermittlung und ‑analyse vorgestellt.
Business Analyst
Data Analyst
Data Engineer
Analytics Engineer
Data Scientist
Business Analyst
Obwohl es gewisse Ähnlichkeiten zwischen einem Data Analyst und einem Business Analyst gibt, besteht der Hauptunterschied darin, wie die Daten jeweils genutzt werden. Ein Business Analyst befasst sich mehr mit den wirtschaftlichen Abläufen in einem Unternehmen und ist darauf spezialisiert, die visualisierten Daten zu interpretieren. Oftmals können die Rollen des Data Analyst und des Business Analyst von einer Person ausgeübt werden.
Data Analyst
Ein Data Analyst ermöglicht es Unternehmen, den Wert ihrer Datenvermögenswerte durch Visualisierungs‑ und Berichtstools wie Microsoft Power BI zu maximieren. In den Verantwortungsbereich eines Data Analysts fallen die Profilerstellung, das Bereinigen und das Transformieren von Daten. Zu ihren Verantwortlichkeiten zählen ebenfalls das Planen und das Aufbauen leistungsfähiger sowie flexibler Datenmodelle und das Bereitstellen sowie Umsetzen der fortgeschrittenen Analysefunktionen in Berichten für die Analyse. Zusammen mit den zuständigen Projektbeteiligten identifizieren Data Analysts geeignete und erforderliche Daten‑ und Berichterstellungsanforderungen und sind dafür verantwortlich, Rohdaten in nützliche und aussagekräftige Erkenntnisse umzuwandeln.
Ein Datenanalyst ist auch für die Verwaltung von Power BI-Anlagen verantwortlich, einschließlich Berichten, Dashboards, Arbeitsbereichen und der zugrunde liegenden semantischen Modelle, die in den Berichten verwendet werden. Ihre Verantwortung besteht darin, passende Schutzmaßnahmen unter Berücksichtigung der Erwartungen der Stakeholder einzuführen und einzurichten, um die geschützte Speicherung sämtlicher Power BI-Anlagen und ihrer Daten sicherzustellen.
Data Engineer
Data Engineers stellen lokal und in der Cloud Datenplattformtechnologien bereit und richten diese ein. Sie verwalten und sichern den Datenfluss strukturierter und nicht strukturierter Daten aus verschiedenen Datenquellen. Dabei nutzen sie u. a. relationale Datenbanken, nicht relationale Datenbanken, Datenströme und Dateispeicher. Data Engineers sorgen auch dafür, dass Datendienste sicher und nahtlos über Datenplattformen hinweg integriert werden.
Zu den Hauptaufgaben von Dateningenieuren gehört die Verwendung von lokalen und Cloud-Datendiensten und ‑Tools zum Extrahieren, Transformieren und Laden von Daten aus verschiedenen Quellen. Data Engineers erarbeiten zusammen mit den Beteiligten im Unternehmen die Datenanforderungen und sorgen auch in Zusammenarbeit mit diesen dafür, dass die Anforderungen erfüllt werden. Sie entwerfen und implementieren Lösungen.
Obwohl sich die Aufgaben und Zuständigkeiten eines Data Engineer teilweise mit denen eines Datenbankadministrators überschneiden, reicht der Arbeitsbereich eines Data Engineer weit über die Verwaltung einer Datenbank und des Datenbankservers hinaus. Ausgenommen ist oftmals die Gesamtverwaltung der operativen Daten.
Data Engineers leisten einen wertvollen Beitrag zu Business Intelligence‑ und Data Science-Projekten. Durch das Zusammenführen der Daten (oft als Data Wrangling bezeichnet) kommen Projekte schneller voran, da sich die Data Scientists auf ihren eigentlichen Aufgabenbereich konzentrieren können.
Als Data Analyst stellen Sie in enger Zusammenarbeit mit einem Data Engineer sicher, dass Sie Zugriff auf die verschiedenen strukturierten und unstrukturierten Datenquellen zur Optimierung von semantischen Modellen besitzen, die üblicherweise aus einem modernen Data Warehouse oder Data Lake gespeist werden.
Analytics Engineer
Analytics Engineers schließen die Lücke zwischen Datentechnik und Analyse, indem sie Datenvermögenswerte in Data Lakes oder Lakehouses kuratieren, die Datenqualität sicherstellen und Self-Service-Analysen ermöglichen. Sie erstellen semantische Modelle in Power BI, um Daten effektiv aufzubereiten und bereitzustellen. Sie können auch andere Datenspeicher wie Data Warehouses oder Lakehouses vorbereiten.
Es gibt einige Überschneidungen mit der Rolle des Data Engineer, da beide SQL als Abfragesprache in Data Warehouses verwenden und sich beide auf die Datenqualität konzentrieren. Data Engineers erstellen häufig die grundlegenden Pipelines und Infrastrukturen. Analytics Engineers sind näher am Unternehmen und konzentrieren sich auf die Modellierung und Nutzung von Daten für die Berichterstattung/Entscheidungsfindung.
Data Scientist
Data Scientists führen erweiterte Analysen durch, um so den Wert der Daten voll auszuschöpfen. Ihr Aufgabenbereich reicht dabei von beschreibenden Analysen bis hin zu Predictive Analytics. Bei beschreibenden Analysen werden Daten über die sogenannte explorative Datenanalyse (EDA) ausgewertet. Predictive Analytics wird im Zusammenhang mit Machine Learning zur Anwendung von Modellierungstechniken verwendet, um Anomalien oder Muster zu erkennen. Diese Analysen sind ein wichtiger Bestandteil von Vorhersagemodellen.
Descriptive Analytics und Predictive Analytics stellen nur einen Teil des Aufgabenfelds eines Data Scientist dar. Einige Data Scientist arbeiten auch im Bereich des Deep Learning und führen iterative Experimente zur Lösung komplexer Datenprobleme mithilfe von benutzerdefinierten Algorithmen durch.
Einzelberichte deuten darauf hin, dass der Großteil der Arbeit bei einem Data Science-Projekt auf das Data Wrangling und die Entwicklung von Features entfällt. Data Scientists können den Experimentiervorgang beschleunigen, wenn Data Engineers das Data Wrangling effektiv umsetzen.
Auf den ersten Blick scheinen Data Scientists und Data Analysts nicht viele Schnittpunkte bei ihrer Arbeit zu besitzen. Doch dieser Eindruck täuscht. Ein Data Scientist untersucht Daten, um noch unbeantwortete Fragen aufzuspüren. Dabei entwickelt er häufig Hypothesen oder Experimente. An diesem Punkt wendet er sich zur Datenvisualisierung und Berichterstellung an einen Data Analyst.