Strategien


Bedenkliches bei Google & Co.

IDC: Die 5 wichtigen Vs für Big Data

22.03.2012
Von Rüdiger Spies

Der letztgenannte Aspekt ist von entscheidender Bedeutung, um Big-Data-Projekte in Unternehmen zu rechtfertigen. Denn ansonsten sind es nur "normale" ProjekteProjekte, bei denen versucht wird, die stetig wachsenden Datenmengen in den Unternehmen zu speichern. Damit ist aber nichts gewonnen bis auf die Tatsache, dass noch mehr Daten großenteils nutzlos im Unternehmen "herumliegen". Es geht also mit Nichten nur um das noch größere Data Warehouse, das umfangreichere Archiv, noch mehr POS-Daten oder einfach um noch größere Plattenspeicher. Alles zu Projekte auf CIO.de

Wie ein Big-Data-Projekt gelingt

Wie aber gelingt nun ein Big-Data-Projekt? Dazu ist erst einmal erforderlich zu erkennen, dass es keine unstrukturierten Daten gibt. Denn wenn die Daten unstrukturiert wären, könnte man auch keinen zusätzlichen Wert daraus erzeugen. Die von vielen fälschlicherweise als sogenannten unstrukturierten Daten bezeichneten Daten bestehen vielfach aus klassischen Office-Dokumenten, also Textdateien, Präsentationen und Tabellenkalkulationen, sowie Bildern, Sound- und Video-Dateien usw.

Es gilt also, die auf einer höheren Abstraktionsebene vorhandene Struktur in diesen Daten zu erkennen, untereinander und mit klassischen strukturierten Daten zu verknüpfen. Aus diesen automatisch erzeugten Zusatzinformationen müssen sich dann zusätzliche Erkenntnisse und ein Mehrwert für die Unternehmen ergeben.

Das ist durchaus nicht trivial, da semantische Informationen verarbeitet werden müssen und der Begriff der klassischen Datenqualität nur noch eine geringere Gültigkeit hat. Denn halbstrukturierte Daten können widersprüchlich, lückenhaft oder auch einfach falsch sein.

Aus diesem Grunde lässt sich ein weiteres "V" ergänzen: Validity. Es kann als ein Maß für die Widerspruchsfreiheit eine Datenmenge angesehen werden. Man sieht also, dass sich die herkömmlichen Maßstäbe für große Datenmengen, zum Beispiel im Data Warehouse, aus Big Data nicht übertragen lassen.

Zur Startseite