Data Science

Nur das Einstellen von Spezialisten reicht nicht

17.12.2019 von Philipp Ramin
Datenanalyse ist keine One-Man-Show des Data Scientist. Doch viele Fachabteilungen denken das, weil Unternehmen die Datenkompetenz nicht umfassend fördern.
  • Für weite Teile der Unternehmensorganisation stellen Daten nur einen abstrakten Fremdkörper dar.
  • Data Science kann in deutschen Unternehmen ihre Potenziale nicht ausschöpfen.
  • Data Scientists sind in Betrieben oft isoliert, weil eine durchgängige Datenstrategie fehlt.
Meinen es Unternehmen mit der Exzellenz in Data Science wirklich ernst, gilt es die Organisation im Zuge des Datenmanagements als Ganzes auf diese Herausforderung vorzubereiten.
Foto: Dmytro Zinkevych - shutterstock.com

In den letzten Jahren haben sich Experten in der Betonung der Wichtigkeit von Daten für den künftigen Unternehmenserfolg regelmäßig überboten. Ihr Credo: Von der absoluten Prozesstransparenz bis hin zu datengetriebenen Geschäftsmodellen hänge alles von der umfassenden Nutzung großer Datenmengen ab. Viele Unternehmen haben diese Forderungen zumindest in Teilen in ihren Digitalstrategien festgeschrieben.

Dabei werden Ansätze wie IoT-Plattformen, Remote Services und digitale Zwillinge von Produkten sowie Produktionsumgebungen und Prozessen als wichtige Entwicklungsziele aufgegriffen. So viel zur Theorie. Doch wie sieht Operationalisierung aus? Reicht es aus, genügend Datenspezialisten einzustellen, um diese Ziele zu erreichen? Oder muss die Organisation als Ganzes umfassende Kompetenzen im Umgang und der Verarbeitung von großen Datenmengen mittels ganzheitlicher Lernarchitekturen aufbauen?

Um Daten zu nutzen, braucht man Daten. Das scheint trivial, ist aber in der unternehmerischen Praxis oft nicht so einfach. Der Grund: In vielen Unternehmen wurden schlichtweg die Hausaufgaben nicht erledigt, die notwendig sind, um relevante Daten zu sammeln und systematisch nutzbar zu machen.

Häufig hapert es an der Durchgängigkeit der IT-Struktur, weshalb auch heute noch in fast allen Kernprozessen der Unternehmen zum Beispiel Medienbrüche zu finden sind. Mitarbeiter müssen als Nutzer den starren Bedürfnissen gewachsener IT-Strukturen folgen, wodurch Daten an vielen Ecken und Enden erst gar nicht gesammelt, geschweige denn in systematischer Weise genutzt werden können.

Zum Video: Nur das Einstellen von Spezialisten reicht nicht

Daten als zentraler Rohstoff im Unternehmen

Bis dato konnte die IT die viel zu große Schnittstellenvielfalt sowie die geringe Integration der unterschiedlichen, historisch gewachsenen IT-Systeme nur unzureichend lösen. Im Kern folgt die Unternehmens-IT auch heute noch der Logik einer schlecht verknüpften IT-Pyramide, die überaus reaktiv, proprietär und wenig flexibel ausgestaltet ist.

In weiten Teilen der Industrie fehlt es ebenso an einer bereichsübergreifenden Stammdatenstruktur, die zur Beschreibung von Maschinen, Werkzeugen und Produkten notwendig ist und die ebenso als Voraussetzung einer Service-orientierten Architektur (SOA) gilt.Ebenso setzt der überall gehypte digitale Zwilling ein hohes Niveau bei der Stammdatenverfügbarkeit voraus, um die ersten Schritte in diese Richtung gehen zu können.

Insgesamt mangelt es in vielen Betrieben bislang am Mut zur Erarbeitung einer konsistenten Datenstrategie. Ihr Ziel müsste sein, die Ausgestaltung von Prozessen und Infrastrukturfragen für das Datenmanagement so festzulegen, dass Daten tatsächlich als zentraler Rohstoff unternehmensweit und systematisch genutzt werden können. Stattdessen ist die Datenqualität in weiten Teilen schlecht, wodurch viele Prozessverbesserungspotenziale oder Geschäftsmodellideen von Grund auf ausbremst werden.

Unternehmen versuchen, diese Defizite immer öfter durch Einstellung von Data-Science-Experten zu lösen. Trotz einzelner Leuchtturmprojekte bleibt jedoch ein Großteil der beschriebenen Probleme häufig ungelöst. Dies mag an dem Missverständnis des Managements liegen, durch Einstellung einzelner Spezialisten, strukturelle und prozessuale Probleme nachhaltig lösen zu können.

Der Kampf des Data Scientist gegen Excel Files

Eigentlich ist der Data Scientist kein neues Rollenbild. Schon seit Jahrzehnten arbeiten Analysten, Laboranten und Forscher mit großen Datensätzen, um neue Erkenntnisse für ungelöste Fragestellungen zu gewinnen. Der Hype um die digitale Transformation hat allerdings gezeigt, wie viel mehr Potenzial hinter Daten stecken kann und wie wenig der "Otto Normalverbraucher" davon versteht. Und so steht er nun da auf weiter Flur in den Unternehmen, der moderne Don Quijote der digitalen Transformation, der frisch eingestellte Data Scientist, der dafür sorgen soll, dass Daten aller Unternehmensbereiche in wertvolle Erkenntnisse umgewandelt werden.

Data Scientists
Die Aufgaben des Business Developer
Business Developer blicken tief in die Geschäftsprozesse und können Unternehmensziele mit Datenanalysen in Verbindung bringen. Sie entwickeln eine erste Fragestellung oder decken ein Problem auf, das anhand der erhobenen Daten gelöst werden soll. Als Schnittstelle zwischen Geschäftswelt und Technik kann er den Nutzen der Analyseergebnisse am besten einschätzen und arbeitet daher eng mit dem Data Analyst zusammen.
Die Aufgaben des Data Analyst
Der Data Analyst besitzt profunde Kenntnis über datengetriebene analytische Methoden, Data Mining-Verfahren und Techniken der Datenvisualisierung. Mit ihnen können Datensätze automatisch klassifiziert oder hinsichtlich ihrer Ähnlichkeit gruppiert werden. So kann der Data Analyst die Aussagekraft der Daten bewerten und relevante Muster und Auffälligkeiten in den Datenströmen erkennen.
Die Aufgaben des Data Manager
Der Data Manager sorgt dafür, dass die Qualität der Daten optimiert wird und sie durch Metadaten ausreichend beschrieben werden. Dazu zählt, dass sich der Data Manager einen Überblick über die Nutzungsrechte verschafft und bei sensiblen Daten weiß, wofür diese verwendet werden dürfen.
Die Aufgaben des Application Developer
Der Application Developer setzt die Plattform auf, auf der die Daten integriert und die Anwendungen entwickelt und installiert werden. Er beherrscht verschiedene Werkzeuge zur Parallelisierung und Echtzeitverarbeitung, so dass die statistischen Modelle des Data Analysten auch auf großen Datenmengen genutzt werden können.
Die Aufgaben des Security Manager
Der Security Manager sorgt dafür, dass die Zusammenführung, Anreicherung und Analyse von Daten keine Rückschlüsse auf Einzelpersonen zulässt und damit die Persönlichkeitsrechte verletzen könnte. Der Security Manager muss also den Datenschutz organisatorisch und technisch umsetzen.
Die 5 Typen von Data Scientists im Überblick
Das Schaubild zeigt noch einmal alle 5 Typen von Data Scientists und ihre Aufgaben im Überblick.

Der Data Scientist kann im Kern nur dafür sorgen, dass aus den Unmengen an unstrukturierten Daten etwas Relevantes gezogen wird. Er sucht nach dem unbekannten, aber relevanten Zusammenhang. Komplexe mathematische Modelle, Datenbankprogrammierung und Geschäftsverständnis sind dabei sein Handwerkszeug.

Das Beheben von strukturellen oder infrastrukturellen Defiziten, um erst einmal an Daten heranzukommen, sollte hingegen nicht seine originäre Aufgabe sein. Hierzu braucht es die Unterstützung und Mitarbeit aller Fachbereiche und einer IT, die dafür die Voraussetzungen schafft. Data Science kann in deutschen Unternehmen nicht ihre Potenziale nicht ausschöpfen, solange sinnvolle Datenstrukturen nicht verfügbar sind und das Paralleluniversum der Excel Files nicht beerdigt wurde.

Fehlende Datenkompetenz in den Fachabteilungen

Wenn es darum geht, relevante Daten aufzuspüren und nutzbar zu machen, wird in den Fachbereichen heute auf jene neuen Experten verwiesen, deren Aufgabe es doch wäre, "das mit den Daten zu klären" - sozusagen der "Zauberer von Oz der digitalen Transformation". Das gilt vor allem, wenn Unternehmen komplett neue Abteilungen für Data Science aufbauen.

Die gut gemeinte Idee, umfassende Ressourcen in Data Science zu investieren, führt jedoch vermehrt zu einer Isolation dieser Disziplin, anstatt der benötigten Wahrnehmung als Querschnittsfunktion. Der restlichen Organisation wird der Eindruck vermittelt, dass Data Science ausschließlich durch bestimmte Experten in bestimmten Unternehmensbereichen erfolgt und sich an den bestehenden Prozessen in den Fachabteilungen nichts ändern muss.

Das bedeutet letztlich, dass der Data Scientist einen Kampf an mehreren Fronten zu führen hat. Einerseits muss er bei den Fachabteilungen dafür sorgen, dass er Zugriff zu relevanten Daten erhält oder die Grundvoraussetzungen dafür geschaffen werden.

Andererseits muss er auf einer aufklärerischen und fast schon missionarischen Ebene zunächst ein Grundverständnis für Daten, deren Potenziale und deren Anwendung mit Programmiersprachen wie Python in den einzelnen Fachbereichen aufbauen. Das ist notwendig, da Data Scientists in den Fachabteilungen häufig auf eine Mischung aus Nichtwissen und Ablehnung stoßen - ein Umstand, der weniger an den Mitarbeitern selbst liegt, als vielmehr an fehlenden Qualifizierungsmöglichkeiten. Dadurch ist die umfassende Nutzung von Daten mit Vorurteilen behaftet.

Insbesondere in deutschen Unternehmen stehen Daten häufig als Synonym für Überwachung und fehlende Privatsphäre. Software und Daten zählen beispielsweise in industriell geprägten Unternehmen meist nicht zur Kernkompetenz.

Daher müssen Verantwortliche sich die Frage stellen, woher die datengetriebenen Geschäftsmodelle und Effizienzverbesserungen kommen sollen, wenn Daten für weite Teile der Organisation nur einen abstrakten Fremdkörper darstellen. An diesem Defizit werden auch einzelne Experten nichts ändern können, da deren Datenkompetenz nur sehr punktuell Probleme lösen kann. Meinen es Unternehmen wirklich ernst mit der Exzellenz in Data Science, so gilt es die Organisation als Ganzes auf diese Herausforderung vorzubereiten.

In diesem Kontext veröffentlichte die OECD Anfang des Jahres bekräftigende Forschungsergebnisse. Trotz jahrelanger Investitionen in digitale Technologien hat sich der Produktivitätsanstieg in wirtschaftlich wichtigen OECD-Ländern verlangsamt.

In der Untersuchung wird deutlich, dass Digitalisierung zwar Wachstum unterstützen kann, allerdings nur wenn zusätzliche Faktoren zutreffen. Wesentliche Erfolgsfaktoren sind der Studie zufolge in der Entwicklung neuer Skills und den entsprechenden Schulungsmöglichkeiten für Mitarbeiter zu sehen. Damit leitet sich beispielsweise die Frage ab, welche Datenkompetenz die jeweiligen Unternehmensbereiche aufbauen müssen.

Was ist eigentlich Datenkompetenz?

Begriffe wie Digital- oder Datenkompetenz müssen zunächst einmal kritisch gesehen werden, denn sie versuchen etwas zu definieren, was tatsächlich überaus veränderlich und kontextspezifisch ist. Kompetenz, das ist eine schwer greifbare Synthese aus bestimmten Fähigkeiten und Fertigkeiten, die nichts unmittelbar mit formellen Bildungsabschlüssen oder Zertifikaten zu tun hat.

Um das Thema zu operationalisieren, müssen benötigte Kompetenzen, beispielsweise im Umgang mit Daten, in Relation zu einem zukünftigen Arbeitskontext definiert werden. Konkret gilt es für Unternehmen somit herauszuarbeiten, welche Aufgaben zukünftig auf ihre Mitarbeiter und Führungskräfte in den einzelnen Bereichen zukommen. Dazu gehört auch, die meist vage formulierten Unternehmens- und Digitalstrategien sehr konkret auf Bereichs-, Abteilungs- und Personenebene herunterzubrechen.

Beispielsweise findet sich in zahlreichen Unternehmensstrategien die Zielsetzung datengetriebene Geschäftsmodelle zu entwickeln, um das bestehende Produktportfolio gegen den Wettbewerb zu differenzieren. Doch welche Kompetenz lässt sich aus dieser Forderung für eine Vertriebs-, Instandhaltungs-, oder Entwicklungsabteilung ableiten? Welche Personengruppen müssen in der Lage sein, ein Grundverständnis dafür zu entwickeln, wo relevante Prozessdaten heute noch ungenutzt bleiben?

Welche Mitarbeitergruppen müssen ganz grundsätzlich sprechfähig in Bezug auf den Stellenwert von Daten gemacht werden? Welche Mitarbeiter werden eine aktivere Rolle hinsichtlich der Identifikation von Datenpotenzialen oder der Interpretation von datenbasierten Kennzahlen einnehmen und damit weitergehende Kenntnisse benötigen? Fragen wie diese können in einer unternehmensweiten Kompetenzarchitektur ganzheitlich und systematisch zusammengefasst werden, um die Organisation auch in der Breite Schritt für Schritt zu transformieren. Eine solche Architektur zeigt auf, wie die unterschiedlichen Entwicklungspfade für Mitarbeiter und Führungskräfte in den Unternehmensbereichen hinsichtlich zentraler Zukunftsthemen und damit auch für Data Science aussehen.

Data Science zur unternehmensweiten Kernaufgabe entwickeln

Wichtig ist dabei die Erkenntnis, dass die eigentliche Auswertung von Daten nur einen Teil der gesamten Datenwertschöpfungskette ausmacht. Möchte ein Unternehmen beispielsweise prädiktive Remote-Dienstleistungen für Nachbestellungen oder Servicefälle entwickeln und verkaufen, setzt dies in allen Unternehmensbereichen voraus, dass Daten konsequent auf unterschiedlichen Anspruchsebenen genutzt und weitergegeben werden.

Der Data Scientist kann in diesem Gesamtprozess zwar als Nukleus agieren, jedoch bedarf es der Unterstützung vieler Bereiche, um die notwendige Datenqualität- und Durchgängigkeit zu erreichen. Hierfür muss eine gemeinsame Basis geschaffen werden, so dass nicht nur der fachliche Verstand Platz findet, sondern auch Mut zur Veränderung und zur Zusammenarbeit erzeugt wird. Dementsprechend ergibt sich auch für den bereits fachlich ausgebildeten Data Scientist kontinuierlich Weiterbildungsbedarf. Mathematik und Programmierung sind wichtig, aber die Kommunikation und Empathie für sein Umfeld sind es genauso, weshalb auch ein Data Scientist Lernpfade durchlaufen muss.

Eine entsprechende Kompetenzarchitektur für Data Science umfasst daher zumeist ein fachliches Fundament, das für alle Mitarbeiter sehr ähnlich ist. Mit einer Kombination aus digitaler Wissensvermittlung durch modularisierte E-Learning-Nuggets und praktischen Übungsmöglichkeiten in Data Labs lässt sich dieses Fundament zielorientiert und kosteneffizient entwickeln.

Darauf aufbauend können dann in einem zweiten Schritt vertikale Kompetenzsäulen hinzugefügt werden, um konkrete Tools und tieferes Methodenwissen bestimmten Mitarbeitergruppen domänenspezifisch zugänglich zu machen. Diese Pfade sind ein wesentlicher Bestandteil einer umfassenden Kompetenzarchitektur, um nicht nur Grundlagen, sondern auch Umsetzungskompetenz ganzheitlich aufzubauen. Unabhängig von der genauen Ausgestaltung, gilt es, diese Architekturen regelmäßig zu aktualisieren und zu erweitern, um mit der Vielzahl neuer Technologien und der Schnelllebigkeit der Entwicklungen Schritt halten zu können.

Entscheider sollten den beträchtlichen Aufwand hinter dieser Aufgabe nicht scheuen, da so eine Transformation von innen heraus gelingen kann, ohne in die Abhängigkeit von Beratern oder Headhuntern zu geraten. Soll der Data Scientist im Unternehmen seine volle Wirkung entfalten, um das "Herz" der digitalen Transformation zum Schlagen zu bringen, muss er die Mitarbeiter mitnehmen können. Dies erscheint nur mit Mut zu einem Gesamtkonzept im Management möglich.