Laut der Bitkom-Studie "Der Arbeitsmarkt für IT-Fachkräfte" vom November 2014 gibt es in Deutschland derzeit in Unternehmen der Informationstechnologie und Telekommunikation rund 16.500 freie Stellen, die zu drei Vierteln von Software-Entwicklern besetzt werden sollen. Diese sollten neben Fähigkeiten im Bereich Cloud Computing (53 Prozent) vor allem Kenntnisse im Bereich Big Data (44 Prozent) mitbringen.
Der Bedarf an gut ausgebildeten Fachkräften für Big Data zeigt, dass deutsche Unternehmen mittlerweile den hohen Wert von Daten erkannt haben und sich immer mehr zu "data-driven Companies" entwickeln. Hierfür benötigen sie spezielle Fachkräfte - Data Scientists - , die wissen, wie sie Big Data nutzen müssen, um automatisiert Ereignisse zu erkennen und einzuschätzen, Entwicklungen kurzfristig vorherzusagen und Entscheidungen zu treffen. Auf dieser Basis können Firmen dann ihre Unternehmensführung effizienter gestalten, neue individualisierte Dienstleistungen anbieten oder intelligente Produkte entwickeln.
Die Anforderungen an solche Spezialisten sind hoch. Sie bilden die Schnittstelle zwischen Technik und Business sowie Daten und Personen und verfügen zudem über umfassendes Wissen - sowohl über Big Data, als auch über ihr Unternehmen und die Branche, in der sie tätig sind.
5 Typen von Data Scientists
Spezialisten, die in allen Big Data-Bereichen gleich gut ausgebildet sind, findet man allerdings schwer. Deshalb bilden größere Unternehmen ITler, Physiker, Mathematiker und Betriebswirte zu einem Team an Data Scientists aus. Diese Experten greifen alle auf die gleichen Grundlagen zurück, haben sich jedoch auf verschiedene Big-Data-Bereiche spezialisiert. Solche Teams bestehen in der Regel aus Business Developern, Data Analysten, Data Managern und Application Developern. Die Arbeitsschritte der einzelnen Expertinnen und Experten gehen fließend ineinander über.
1. Aufgaben des Business Developer
Business Developer haben tiefe Einblicke in die Geschäftsprozesse und können Unternehmensziele mit Datenanalysen in Verbindung bringen. Sie entwickeln eine erste Fragestellung oder decken ein Problem auf, das anhand der erhobenen Daten gelöst werden soll, etwa das Problem von Kunden Kündigungen. Ein tieferes technisches Verständnis ist für den Business Developer unabdingbar, da er nur so die Machbarkeit seiner Ideen einschätzen kann. Als Schnittstelle zwischen Geschäftswelt und Technik kann er den Nutzen der Analyseergebnisse am besten einschätzen und arbeitet daher eng mit dem Data Analyst zusammen.
2. Aufgaben des Data Analyst
Der Data Analyst besitzt profunde Kenntnis über datengetriebene analytische Methoden, Data Mining-Verfahren und Techniken der Datenvisualisierung. Mit ihnen können Datensätze automatisch klassifiziert oder hinsichtlich ihrer Ähnlichkeit gruppiert werden. So kann der Data Analyst die Aussagekraft der Daten bewerten und relevante Muster und Auffälligkeiten in den Datenströmen erkennen. Ist er fündig geworden, prüft er, ob sich hinter den Mustern eine neue oder für die Fragestellung wichtige Erkenntnis verbirgt. Daraufhin kann er die Fragestellung mit dem Business Developer präzisieren oder in eine neue Richtung lenken.
Schließlich entscheidet der Data Analyst, welches statistische Modell am besten geeignet ist, um an die gewünschten Informationen zu gelangen. Für Kündigungsvorhersagen werden beispielsweise Assoziationsregeln erzeugt, die beschreiben, welche Kombination spezieller Eigenschaften ein Kunde besitzt, der bald kündigt. So kann das Modell eigenständig eine Warnung aussprechen, die beispielsweise dazu führt, dass dem Kunden ein günstigeres Angebot unterbreitet wird, um ihn zum Bleiben zu bewegen.
3. Aufgaben des Data Manager
Zuvor müssen die strukturierten und unstrukturierten Daten, die zum Teil aus heterogenen Quellen stammen, jedoch in eine gemeinsame Datenbank gebracht und integriert werden. Hier sorgt der Data Manager dafür, dass die Qualität der Daten langfristig optimiert wird und sie durch Metadaten ausreichend beschrieben werden. Dazu zählt, dass sich der Data Manager einen Überblick über die Nutzungsrechte verschafft und bei sensiblen Daten weiß, wofür diese verwendet werden dürfen.
4. Aufgaben des Application Developer
Der Application Developer setzt die Plattform auf, auf der die Daten integriert und die Anwendungen entwickelt und installiert werden. Er beherrscht verschiedene Werkzeuge zur Parallelisierung und Echtzeitverarbeitung, so dass die statistischen Modelle des Data Analysten auch auf großen Datenmengen genutzt werden können. Dabei muss der Application Developer den richtigen Mittelweg finden zwischen Antwortverhalten, Robustheit und Kosten des Systems.
5. Aufgaben des Security Manager
Im Hintergrund des kompletten Data-Mining Prozesses arbeitet der Security Manager, der für ein übergreifendes Sicherheitsmanagement im Unternehmen zuständig ist. Er sorgt dafür, dass die Zusammenführung, Anreicherung und Analyse von Daten keine Rückschlüsse auf Einzelpersonen zulässt und damit die Persönlichkeitsrechte verletzen könnte.
Der Security Manager muss also den Datenschutz organisatorisch und technisch umsetzen. Unter dem Stichwort "privacy-preserving" Analytik werden Daten komprimiert oder ausgedünnt, so dass daraus keine personenspezifischen Daten zurückgewonnen werden können.
Der Security Manager sorgt zudem dafür, dass Daten nicht in fremde Hände gelangen, also sicher übertragen und verwahrt werden. Dazu setzt er einschlägige Verschlüsselungs- und Schutzmechanismen ein und installiert Protokolle, die zeigen, welchen Weg die Daten im Unternehmen zurücklegen.
Herstellerneutrale Weiterbildungen zum Data Scientist
"Da das Berufsbild des Data Scientist in Deutschland relativ neu ist, suchen viele Unternehmen Unterstützung bei der Qualifizierung ihrer Mitarbeiterinnen und Mitarbeiter im Bereich Big Data", sagt Dirk Hecker, Geschäftsführer der Fraunhofer-Allianz Big Data.
Häufig böten Software-Hersteller Kurse an, die den Teilnehmenden die Verwendung ihrer eigenen Tools vermitteln. "Data Scientists müssen jedoch eine Vielzahl unterschiedlicher Methoden, Herangehensweisen und Analyse-Tools beherrschen, um herauszufinden, welche die besten Ergebnisse für ihre spezifische Anwendung liefern", fährt Hecker fort.
So bieten unter dem Dach der Fraunhofer Academy auch die Institute der "Fraunhofer-Allianz Big Data" Schulungen für Data Scientists an, die sich an Business Developer, Data Analysts, Data Manager und Application Developer richten.
"In unseren Kursen vermitteln ein systematisches Verständnis für die grundsätzliche Herangehensweise und die Vor- und Nachteile der Methoden", erläutert Hecker. "Wir geben den Teilnehmenden herstellerneutral Kriterien an die Hand, mit denen sie die Tools beurteilen können."
Weitere Informationen finden Sie auf der Seite der Fraunhofer Academy.