Mit der Erkenntnis von Daten als wichtigstem Rohstoff entstand das Berufsbild des Data Scientists. Bevor Unternehmen einen solchen suchen, plädiert der US-Marktforscher Forrester für eine Begriffsklärung. Die Analysten grenzen den Begriff insbesondere gegen Enterprise-Architekten und Data-Engineers ab. In dem Papier "The four things Data Scientists wish you knew" führen sie das aus.
Die Studie basiert nicht auf einer quantitativen Befragung. Forrester hat mit zehn Data-Science-Leadern gesprochen und weitere zehn Unternehmen befragt, die Advanced Analytics anwenden. Einer der Gesprächspartner war Andrew Jennings, Chief Analytics Officer beim Analytics-Software-Unternehmen FICO. Er sagte, die Welt eines Data Scientist sei sowohl den meisten Informatikern als auch den meisten Betriebswirten vollkommen fremd.
Für Forrester sollen Data Engineers und Enterprise-Architekten vor allem Ordnung und Struktur in die Datenflut bringen. Bei Data Scientists geht es dagegen um den Prozess des Erforschens der Daten an sich. Das Explorative sei wichtiger als der Algorithmus, so Forrester.
4 Merkmale der Arbeitsweise von Data Scientists
Forrester sieht die Arbeit der Data Scientists durch vier Prinzipien geprägt. Sie lauten:
1. Data Scientists müssen mit Data-Engineers und dem Business ein Team bilden. Die befragten Data Scientists beklagten sich bei Forrester über zu hohe Erwartungen durch das Business. Man werfe ihnen irgendwelche Schlagworte hin und erwarte, dass sie aus Daten generierte Erkenntnisse anbrächten.
Das funktioniere nicht, so die Befragten weiter. Sie wünschen sich ein Team: Vertreter des Business leiten Data Scientists an, die dann Hypothesen und Annahmen entwickeln. Data Engineers unterstützen diesen Prozess, das Stichwort lautet hier DevOps. Das Kunstwort aus Development und Operations soll die Lücke zwischen dem explorativen Prozess und dem strukturgebenden schließen.
2. Data Scientists nehmen gerne Rohdaten. Unternehmens-Architekten meinen es ja nur gut, wenn sie Daten gesäubert, geordnet und strukturiert präsentieren, weiß Forrester. Aber Data Scientists brauchen den Zugriff auf Rohdaten, weil sie experimentell arbeiten.
3. Der Prozess an sich kann Erfolge erzielen. Die Erfolgskontrolle gestaltet sich bei Predictive Analytics sehr schwierig. Finanzielle Benefits lassen sich schwer bemessen. Unternehmen müssen verstehen, dass Data Scientists möglicherweise "zufällig" auf wichtige Zusammenhänge stoßen oder über Umwege an interessante Ergebnisse kommen. In jedem Fall gewinnen sie Erkenntnisse über unternehmensinterne Prozesse.
4. Geschwindigkeit ist wichtig. Frameworks wie Hadoop unterstützen Data Scientists. Denn ihre Arbeit ist iterativ und generiert immer mehr Daten. Je schneller die IT Daten managen kann, umso besser.
Forrester geht davon aus, dass viele Unternehmen bereits Data Scientists suchen oder in Kürze mit der Suche starten werden. Die gewünschten Skills kreisen um Large-Scale Predictive Modeling, Data Mining, Advanced Analytics und Big Data.