Strategien


Prognosen via Datenanalyse

Darauf ist bei Predictive Analytics zu achten

Jürgen Mauerer ist Journalist und betreibt ein Redaktionsbüro in München.

Auswahl der Datensätze

Nach der Analyse der Geschäftsprozesse und dem Festlegen der Ziele folgt die Auswahl der Daten, die für die konkrete Analyse relevant sind. "Ausgangspunkt ist immer die konkrete Fragestellung. Sie können nicht die komplette Datenbasis verwenden, erläutert Dr. Michael Milnik, Team Lead Customer Analysis bei der Blue Yonder GmbH, einem Anbieter von Predictive-Analytics-Lösungen. Dabei sei es meist wirtschaftlich sinnvoller, die Daten zuzuschneiden, die später über Algorithmen und Vorhersagemodelle ausgewertet werden.

"Es ist äußerst wichtig, gemeinsam mit Experten die Projekte schrittweise zu erarbeiten und auch die Datenquellen sukzessive zu erweitern." Michael Milnik, Blue Yonder
"Es ist äußerst wichtig, gemeinsam mit Experten die Projekte schrittweise zu erarbeiten und auch die Datenquellen sukzessive zu erweitern." Michael Milnik, Blue Yonder
Foto: Blue Yonder

Im obigen Beispiel bildeten alle internen Daten rund um die Produkt-/Waren-Gruppe Schnupfenspray die Basis für die Analyse. "Stehen bei der Prognose einzelne Kunden oder Kundengruppen im Fokus, sind vor allem die Kundendaten relevant, weniger die Produktdaten. Die Auswahl der Datensätze hängt also immer von der Fragestellung ab, lässt sich aber Schritt für Schritt erweitern", so Milnik weiter. Interne Daten werden meist um externe Informationen wie Wetterdaten oder Ferien- und Feiertags-Termine ergänzt, um aussagekräftige Prognosen zu erhalten.

Voraussetzung: Leistungsstarke Datenbank-Infrastruktur

Grundlegende Voraussetzung für die effiziente Datenanalyse ist ein leistungsfähiges Data Warehouse, beziehungsweise eine geeignete Big Data-Infrastruktur, die auch große Datenmengen schnell auswertet. Blue Yonder setzt beispielsweise das analytische In-Memory Datenbanksystem von Exasol ein. Das System kommt mit verschiedenen Formen von Daten zurecht, vereinheitlicht und verbindet diese. Im Rahmen von Predictive Analytics ist es unerlässlich, Daten aus unterschiedlichsten Quellen zu aggregieren und zu analysieren. Sämtliche Datenquellen (Maschinen, Prozesse, Produkte, Wetterdaten etc.) und Systeme (ERP, CRM, BI etc.) müssen miteinander integriert werden.

Eine weitere Herausforderung ist es, die große Vielfalt von Datentypen und Formaten sowie die Qualität der einzelnen Daten umfassend zu verstehen und daraus entsprechende Einsichten zu gewinnen. Die Daten sollten natürlich alle Kriterien für hohe Qualität erfüllen wie Korrektheit, Konsistenz, Vollständigkeit, Aktualität oder Einheitlichkeit. Insbesondere für Predictive Analytics müssen genügend historische Daten vorhanden sein, damit sich diese mit geeigneten Prognosetechniken aussagekräftig in die Zukunft fortschreiben lassen.

Iterativer Prozess mit passendem Methoden-Mix

Es gibt viele unterschiedliche Methoden und Vorhersagemodelle, um aus Daten Prognosen abzuleiten. Sie reichen von klassischen Data-Mining-Methoden wie Clustering oder Regressionsanalyse über Elemente der Spieltheorie bis hin zum maschinellen Lernen. Bei letzterem werden die Algorithmen so trainiert, dass sie aus den vorliegenden Daten lernen, selbstständig ein Datenmodell erzeugen und dieses für Prognosen oder Entscheidungen einsetzen.

Zur Startseite