Die stetige Zunahme von unterschiedlichen Daten und Datentypen bringt immense Vorteile mit sich. Immer mehr Daten aus unterschiedlichen Quellen und in unterschiedlichen Formaten bieten den Unternehmen umfassende Einblicke und führen in der Folge zu besseren Entscheidungen und Unternehmensergebnissen. Soweit die Theorie. Fragen Sie jedoch einen x-beliebigen Data Scientist, wird er sehr wahrscheinlich eine andere Realität mit Ihnen teilen: Daten-Analysten verbringen einen Großteil ihrer Arbeitszeit mit Such-, Datenaufbereitungs-, Management- und Governance-Aktivitäten. Für die Datenanalyse, in der der eigentliche Wert des Datengoldes liegt, bleibt kaum Zeit.
Es steht 80:20
Tatsächlich ist die Aufteilung der Zeit, die für die Datenaufbereitung im Vergleich zur Datenanalyse aufgewendet wird, sehr ungewichtet: weniger als 20 Prozent der Zeit werden für die Datenanalyse genutzt, während rund 80 Prozent der zur Verfügung stehenden Zeit auf die Suche, Aufbereitung und Verwaltung der entsprechenden Daten entfallen.
Warum die Datenmanagementzeitkrise nur noch schlimmer wird
Die Zahl der zu erfassenden und zu analysierenden Arten von Daten nimmt zu. In einer aktuellen IDC-Studie gaben 80% der rund 300 Befragten an, dass in den nächsten 24 Monaten die Zahl der zu analysierenden Datenarten deutlich zunehmen wird. Verschiedene Arten von Daten erfordern zusätzliche Datenrecherche und -erfassung, was den Zeitaufwand für die Datenverwaltung weiter erhöht und noch weniger Zeit für aussagekräftige Analysen lässt.
Auch die zu analysierenden Daten werden immer komplexer, was den Zeitaufwand für das gesamte Datenmanagement zusätzlich erhöht. Tatsächlich geht IDC davon aus, dass sich die Datenmengen bis 2025 weltweit um das Zehnfache erhöhen werden. Es ist also absehbar, dass sich das ungünstige Verhältnis zunehmend weiter verschiebt, so dass faktisch immer weniger Zeit für die Analyse bleibt und damit der eigentliche Wert der Daten für das Unternehmen überhaupt nicht mehr gehoben werden kann. Compliance und neue Regelungen zur Datenerhebung und -nutzung, wie die EU-DSGVO und der damit zusätzlich erhöhte Zeitaufwand für die Datenaufbereitung tun ihr übriges.
Vorlaufzeiten für das Datenmanagement reduzieren
Unternehmen, die ihre Daten-Analysten in die Lage versetzen wollen, aus ihren Daten aussagekräftige Erkenntnisse zu gewinnen, sollten unbedingt die Technologien der sog. 3rd Platform geschickt einsetzen, um die Vorlaufzeiten für das Datenmanagement zu reduzieren. Machine Learning hat das Potenzial, die Art und Weise, wie Daten verwaltet werden, zu optimieren und viele der mit Daten verbundenen Aufgaben und Prozesse zu automatisieren. Konkret geht es darum, welche Daten-Visualisierungen für ein bestimmtes Szenario am besten geeignet sind oder welcher Algorithmus für den jeweiligen Anwendungsfall verwendet werden soll.
Um Machine Learning erfolgreich in das Datenmanagement zu integrieren, müssen Unternehmen zunächst ihren Datennutzen und -verbrauch ermitteln. Sie sollten Analysen durchführen, um zu evaluieren, welche sich wiederholenden Datenverwaltungsaufgaben automatisiert werden können.
Das wachsende Angebot an Data Intelligence Software ermöglicht es den Organisationen, neue Erkenntnisse und Einblicke hinsichtlich ihres Datenkonsums zu gewinnen. Kognitive Lösungen zur Datenanalyse können aus diesen Erkenntnissen lernen und sich wiederholende Aufgaben aus dem Entscheidungsprozess eliminieren bzw. automatisieren.
Fazit
Die 80/20-Ratio ist für die meisten Unternehmen zwar momentan traurige Realität, zum Dauerzustand muss sie jedoch nicht werden. Durch die Identifizierung und Automatisierung der zeitaufwändigsten, sich wiederholenden Aufgaben können Unternehmen ihren Daten-Analysten den nötigen Raum für sinnvolle und zielführende Datenanalysen verschaffen – und auf diese Weise endlich das volle Potenzial aus ihren Daten für das gesamte Unternehmen ziehen.