Daten: Das Öl des 21. Jahrhunderts
Big Data wirtschaftlich sinnvoll einsetzen
Der ehemalige CEO des Business-Netzwerkes Xing, Stefan Gross-Selbeck, bringt es auf den Punkt: "Daten sind das Öl des 21. Jahrhunderts." Unter Big DataBig Data werden gemeinhin sowohl die Daten selbst, als auch deren Eigenschaften und sämtliche Technologien zur Analyse verstanden. Hinter dem Begriff steckt also im Grunde nichts Anderes als die systematische Förderung des neuen "Rohstoffes" mithilfe modernster Technologie. Alles zu Big Data auf CIO.de
Aus Daten werden Wettbewerbsvorteile
Die Verfasser der Studie "Digitales Universum", welche 2014 von EMC und IDC veröffentlich wurde, sagen für dieses Jahr unvorstellbar hohes Datenaufkommen von mehr als 8 Zettabyte voraus - Tendenz steigend. Der überwiegende Anteil davon aus Sozialen Netzwerken, dem 'Internet der Dinge' (IoT) sowie zahlreichen Sensoren aus Maschinen und Fahrzeugen. Das Besondere: Die meisten Daten werden mit stetig wachsender Geschwindigkeit erzeugt, liegen in immer größerer Vielfalt vor und lassen sich so gut wie nie 100-prozentig verifizieren.
Die Herausforderung liegt also darin, dass IT-Systeme nicht nur korrekt mit fehlenden, falschen oder doppeldeutigen Daten umgehen sondern durch deren Analyse eine zuverlässige Grundlage für Businessentscheidungen schaffen müssen - und das möglichst in Echtzeit. Mithilfe neuer Analyseverfahren lassen sich aus Daten wertvolle Informationen gewinnen, mit denen Unternehmen ihre wirtschaftlichen Ziele schneller und kostengünstiger erreichen oder ihre Wettbewerbsposition verbessern können. Darüber hinaus helfen sie Entscheidern dabei, ihre Kunden besser zu verstehen und Produkte und Services schneller und gezielter an den passenden Märkten zu platzieren.
Was in der Theorie einfach klingt, erweist sich in der Praxis oft als echte Herausforderung. "Daten bleiben scheu und grausam. Es ist schwierig, aus ihnen zu lernen, und noch schwieriger, das Gelernte umzusetzen", sagte der Data-Mining-Pionier Nicolas Bissantz bereits vor zwei Jahren in der Zeitschrift "GDI Impuls".
Das bedeutet im Klartext: Nicht aus jeder technisch ableitbaren Wechselbeziehung lässt sich automatisch eine wirtschaftlich sinnvolle Ursache ableiten. Die nutzbringende Auswertung von Daten ist und bleibt also gerade in Zeiten von Big Data ein iterativer und aufwändiger Prozess. Die Planung und Umsetzung entsprechender Vorhaben erfordert reichlich Fachwissen aus den unterschiedlichsten Bereichen. Mit Data Science hat sich ein multidisziplinärer Ansatz für die Aufbereitung, Bereitstellung und den Zugang zu Daten, Analysen und Auswertungen entwickelt.
Wirtschaftliche Vorteile durch Kombination von Daten
Auch wenn die Entwicklung von Big Data noch in den Anfängen steckt - auf den ersten Blick kann die Technologie vor allem eines: interne und externe Daten schnell und umfassend miteinander kombinieren. Ein gutes Beispiel ist die Flottenmanagement-Plattform TomTom WebFleet der Firma TomTom Telematics. Pro Tag verarbeitete das System Mitte 2014 mehr als 500 Millionen Nachrichten, die von 400.000 Fahrzeugen, die insgesamt mehr als 65 Millionen Kilometer zurückgelegt haben.
Die sehr schnelle und einfache Auswertung von Statusinformationen, Positionsangaben, Tachostand und Verbrauchswerte soll laut Managing Director Thomas Schmidt 80 Millionen Euro Treibstoff pro Monat einsparen. Dabei werden beispielsweise Fahrzeiten und Ankunftsinformationen sowie eine Vielzahl unterschiedlicher Statistiken errechnet. Beispiele, die auf einer klugen Kombination interner und externer Daten beruhen, existieren in nahezu jeder Branche.
- Big Data
Unternehmen sollten sich im Klaren sein, welche Daten sie erfassen und welche Ergebnisse sie erzielen wollen. Für Big Data sollten möglichst viele bis alle Daten erfasst werden können. Im Gegensatz zu BI-Lösungen sollten sich Verantwortliche nicht in Nebensächlichkeiten verstricken, sondern immer das große Ganze sehen. - Big Data
Der Branchenverband BITKOM bietet eine kostenlose PDF-Datei, die als Leitfaden für Big Data-Projekte verwendet werden kann. - Big Data
Mit Hadoop und HDInsight in Microsoft Azure können Sie Big Data auch in der Microsoft Cloud betreiben. - Big Data
Um sich mit Hadoop und Big Data zu beschäftigen, ist HDInsight der schnellste Weg. Microsoft stellt für Entwickler eine Offline-Testumgebung für HDInsight zur Verfügung. - Big Data
Um Big Data-Lösungen zu nutzen, benötigen Sie in den meisten Fällen eine NoSQL-Datenbank, zusätzlich zu vorhandenen Datenbanken, beispielsweise MongoDB. - Big Data
Wer sich etwas mit Big Data bereits auseinandergesetzt hat und Lösungen in diesem Bereich einsetzt, kann die Umgebung mit weiteren Möglichkeiten erweitern. Auch hier steht eine Vielzahl an Opensource-Pridukten zur Verfügung, zum Beispiel Apache Giraph. - Big Data
Microsoft noch das kostenlose ebook „Introducing Microsoft Azure HDInsight“ zur Verfügung. Diese bietet einen idealen Einstieg in die Möglichkeiten von Big Data, HDInsight und Hadoop, auch für andere Plattformen. - Big Data
HBase kann als Datenbank für Big Data-Lösungen genutzt werden. Diese Technologie baut auf Google Big Table auf und kann sehr große Datenmengen speichern. - Big Data
Die meisten Unternehmen nutzen für die Verarbeitung von Big Data vor allem Hadoop-Distributionen oder Cloud-Lösungen. Die meisten Tools und Distributionen gehören zum Apache Projekt. Apache Mahout erlaubt eine bessere Verwaltung der Daten in Hadoop. - Big Data
Cloudlösungen bei Microsoft Azure, Google Cloud Platform oder Amazon Web Services, werden oft nach Datenvolumen berechnet und Berechnungsdauer. Entwickler sollten in die Abfragen und die Big Data-Anwendungen daher auch das Herunterfahren und Ausschalten von Big Data-Umgebungen einbeziehen.
Klare Business Cases und Fragestellungen
Eine Vielzahl von Praxisbeispielen und Studien belegen das Potenzial von Big Data. Kein Wunder, dass laut einer Studie des Branchenverbandes BITKOM 48 Prozent der befragten Unternehmen das größte Potenzial von Big Data in der Ergänzung ihrer bisherigen Entscheidungsgrundlagen sehen - heute dürften es sogar noch deutlich mehr sein. Der sinnvolle Einsatz von Big Data setzt jedoch voraus, dass konkrete Business-Cases und Fragestellungen vorhanden sein müssen, die es durch geeignete Methoden zu verifizieren oder falsifizieren gilt. Darüber hinaus ist abzuklären, ob und wann sich der Technologieeinsatz tatsächlich lohnt oder es bereits seit Jahren etablierte Lösungen gibt - für den Einsatz in Banken ist Big Data beispielsweise nur eingeschränkt sinnvoll.
Fazit: Beratung, Pilotprojekte und interner Kompetenzaufbau
Gut vorbereitete Manager wissen in der Regel sehr genau, welche Erkenntnisse sie für die Vorbereitung ihrer Entscheidungen benötigen. Fach- und IT-Abteilungen haben Kenntnis darüber, welche Datenquellen sie dafür verwenden können. Die technischen Möglichkeiten zur Realisierung von Big-Data-Projekten sind jedoch für die meisten Unternehmen bisher kaum vollständig zu überblicken - zumal die Anzahl neuer Datenerfassungsgeräte und Analyseinstrumente stetig weiter zunimmt. Eine Beratung durch externe Experten, die Einstellung eines Data-Science-Spezialisten und der schrittweise Aufbau eines internen Kompetenzteams haben sich in der Praxis gangbarer Weg erwiesen.
Doch komplett ohne Risiko geht es bei Big-Data-Projekten nicht. Vor der eigentlichen Umsetzung ist die Praxistauglichkeit im konkreten Unternehmensumfeld zu prüfen. Dazu ist es ratsam ein Pilotprojekt aufzusetzen und anstelle eines komplexen Analysemodells zunächst einfache Methoden zu nutzen - diese jedoch mit realen Daten zu versorgen. Verläuft das Pilotprojekt erfolgreich und liefert die gewünschten Erkenntnisse, steht einem gezielten Ausbau nichts mehr im Weg.