Vom Hype zur Umsetzung

Checkliste für die Big-Data-Strategie

05.09.2012
Von Andreas Dietze und Curt Cramer
Das Big-Data-Modell unterscheidet sich grundlegend von dem etablierten relationalen Datenmodell.
Das Big-Data-Modell unterscheidet sich grundlegend von dem etablierten relationalen Datenmodell.
Foto: Roland Berger Strategy Consultants

Eine Datenverarbeitungsaufgabe umfasst normalerweise eine Analyse in Form einer Standardabfrage in ausgereiften und nutzerfreundlichen BI-Programmen und eines anschließenden Standardberichts. Für eine Big- Data-Anwendung muss der Analyst zunächst die Datenquellen bestimmen und so aufbereiten, dass sie automatisiert weiterverarbeitet werden können. Der Analyst muss daher Säuberungsregeln, Datenformate und die wichtigsten Kenngrößen unter den vielen Datenquellen im Vorfeld festlegen. Dieser explorative Ansatz unterscheidet sich von dem heute üblichen, standardisierten Vorgehen.

Visualisierung statt standardisierter Berichte

Die Visualisierung spielt hierbei eine besondere Rolle: Berichte helfen heute, Analyseergebnisse in einheitlicher Form an die Entscheider zu kommunizieren. Bei der Entwicklung einer Big-Data-Anwendung greift aber der Analyst nicht auf standardisierte Berichte zurück, sondern nutzt die Visualisierung als Hilfsmittel, um statistische Muster und Verläufe schnell erkennen zu können. Erst im nächsten Schritt kann er dem Kunden durch Standardberichte Fakten präsentieren, die aus verschiedenen Datenquellen zusammengesetzt sind.

Für einen Hadoop-basierten Analyseansatz benötigen die Experten aber gute Kenntnisse des Frameworks selbst sowie angrenzender Technologien (HDFS, HBase, Hive, Mahout). Diese Fähigkeiten sind jedoch nicht nur für die Analyse erforderlich, sondern auch schon im Vorfeld, um die Big-Data-Ansätze zu bewerten. Unternehmen können heute intern nicht auf die entsprechenden Ressourcen zurückgreifen. Denn die notwendigen Technologien wurden nicht von den führenden Datenbankherstellern entwickelt; Unternehmensmitarbeiter kennen sich folglich nicht damit aus. CIOs sollten daher Innovationsimpulse sowohl in ihren IT-Bereich als auch in die Fachbereiche geben.

Schritt für Schritt zur Big-Data-Strategie

Unabhängig von der heutigen Verfügbarkeit von Out-of-the-Box-Lösungen müssen Unternehmen frühzeitig eine Strategie entwickeln, um ihre Daten sinnvoll zu nutzen. Eine "Data Due Diligence" hilft dabei, die wesentlichen strategischen Fragen zu beantworten.

Eine Checkliste:

  • Welche Herausforderungen soll die Datennutzung lösen?

  • Warum sollen diese Herausforderungen gelöst werden? Wie sieht der Business-Case aus?

  • Welche Daten benötigt das Unternehmen dafür?

  • Welche Daten liegen heute in welchen Systemen vor? Ist der Detailgrad ausreichend?

  • Welche der erforderlichen Daten werden heute noch nicht systematisch erfasst?

  • Können die fehlenden Daten als Nebenprodukt bestehender Prozesse erzeugt werden? Oder sind neue Erfassungswege dafür erforderlich?

Zur Startseite