Vom Hype zur Umsetzung
Checkliste für die Big-Data-Strategie
Eine Datenverarbeitungsaufgabe umfasst normalerweise eine Analyse in Form einer Standardabfrage in ausgereiften und nutzerfreundlichen BI-Programmen und eines anschließenden Standardberichts. Für eine Big- Data-Anwendung muss der Analyst zunächst die Datenquellen bestimmen und so aufbereiten, dass sie automatisiert weiterverarbeitet werden können. Der Analyst muss daher Säuberungsregeln, Datenformate und die wichtigsten Kenngrößen unter den vielen Datenquellen im Vorfeld festlegen. Dieser explorative Ansatz unterscheidet sich von dem heute üblichen, standardisierten Vorgehen.
Visualisierung statt standardisierter Berichte
Die Visualisierung spielt hierbei eine besondere Rolle: Berichte helfen heute, Analyseergebnisse in einheitlicher Form an die Entscheider zu kommunizieren. Bei der Entwicklung einer Big-Data-Anwendung greift aber der Analyst nicht auf standardisierte Berichte zurück, sondern nutzt die Visualisierung als Hilfsmittel, um statistische Muster und Verläufe schnell erkennen zu können. Erst im nächsten Schritt kann er dem Kunden durch Standardberichte Fakten präsentieren, die aus verschiedenen Datenquellen zusammengesetzt sind.
Für einen Hadoop-basierten Analyseansatz benötigen die Experten aber gute Kenntnisse des Frameworks selbst sowie angrenzender Technologien (HDFS, HBase, Hive, Mahout). Diese Fähigkeiten sind jedoch nicht nur für die Analyse erforderlich, sondern auch schon im Vorfeld, um die Big-Data-Ansätze zu bewerten. Unternehmen können heute intern nicht auf die entsprechenden Ressourcen zurückgreifen. Denn die notwendigen Technologien wurden nicht von den führenden Datenbankherstellern entwickelt; Unternehmensmitarbeiter kennen sich folglich nicht damit aus. CIOs sollten daher Innovationsimpulse sowohl in ihren IT-Bereich als auch in die Fachbereiche geben.
Schritt für Schritt zur Big-Data-Strategie
Unabhängig von der heutigen Verfügbarkeit von Out-of-the-Box-Lösungen müssen Unternehmen frühzeitig eine Strategie entwickeln, um ihre Daten sinnvoll zu nutzen. Eine "Data Due Diligence" hilft dabei, die wesentlichen strategischen Fragen zu beantworten.
Eine Checkliste:
|