Information Management-Strategie für Big Data

Welche 8 Punkte ein IM-System erfüllen muss

26.04.2013 von Andreas Schaffry
Big Data braucht ein effizientes Information Management (IM). Quocirca nennt acht Punkte auf die Firmen bei der Anschaffung eines IM-Systems achten sollten.

Analysten und Marktkommentatoren verwenden den Begriff "Big Data" häufig fälschlich als Synonym für eine große Datenmenge. Doch bei Big Data geht es nicht allein um die Verwaltung eines hohen Datenvolumens und unterschiedlicher Datentypen. Es geht auch darum, geschäftlich relevante Daten anzureichern und schnell, strukturiert, in hoher Qualität sowie Compliance-konform bereitstellen zu können. Zugleich ist jederzeit eine hohe Verfügbarkeit zu garantieren.

Big Data braucht Information Management

Für die effiziente Verwaltung von Big Data brauchen Unternehmen eine Information-Management-Strategie.
Foto: Ben Chams - Fotolia.com

Hierfür wird eine Strategie für das Informationsmanagement benötigt, die die Umwandlung von Datensätzen in geschäftlich nutzbare Informationen und letztlich in Geschäftswissen ermöglicht. Die Voraussetzung dafür bildet die Implementierung eines integrierten Information-Management-(IM)-Systems. Die britische IT-Beratungsfirma Quocirca nennt in ihrer Untersuchung "Beyond Big Data - The New Information Economy" acht Punkte, auf die Unternehmen bei einer IM-Lösung achten sollten.

1. Deduplizierung: Durch Deduplizierung lässt sich eine redundante Datenhaltung vermeiden, denn doppelt oder mehrfach vorhandene Dateien werden gefunden und davon nur eine Kopie abgespeichert. Am meisten Speicherplatz lässt sich durch eine Block-basierte Deduplizierung sparen, bei der ganze Storage-Systeme miteinander abgeglichen werden können. Laut Quocirca sollen sich auf diese Weise rund 80 Prozent des Storage-Bedarfs einsparen lassen.

2. Metatagging: Viele Dokumente werden bei ihrer Entstehung, Veröffentlichung und Speicherung standardmäßig mit Metadaten versehen. Durch das Hinzufügen weiterer Metatags können spezielle Such- und Reporting-Anforderungen aus dem Business wie auch IT-Sicherheitspolicies besser erfüllt werden. So können Dokumente mit Metatags als öffentlich, vertraulich oder geheim klassifiziert werden. Wird versucht, ein als geheim eingestuftes Dokument per Mail an die Konkurrenz zu senden, wird dies automatisch blockiert.

3. Indexierung: Durch eine effektive Indizierung entsteht ein schlanker Datenbestand, der sich schnell durchsuchen lässt, gleichzeitig werden IT-Ressourcen geschont. Ein Index stellt eine Referenz für alle Datenelemente bereit, die auf die Originaldaten und -dokumente im primären Storage-System verweist.

Die passende Storage-Strategie umsetzen

Unternehmen müssen eine Vielzahl unterschiedlichster Datentypen effektiv verwalten und für das Business nutzen können.
Foto: kentoh - Fotolia.com

4. Sicherheit: Geschäftsdaten sind intellektuelles Eigentum einer Firma und somit gegen Missbrauch und Diebstahl abzusichern. IM-Systeme müssen deshalb sowohl die Rollen von Beschäftigten als auch von Kunden und Partnern bewältigen und zugleich Informationen sicher verwalten können, um Datenlecks zu vermeiden. Wenn möglich sollten Such- und Dokumenten-Indices immer verschlüsselt werden.

5. Datenmanagement und Archivierung: Die langfristige Speicherung werthaltiger Daten ist ein Kernbereich in jeder IM-Strategie. Mit einem Storage-Tiering lassen sich die Speicherprozesse optimieren und Daten auf Speichersysteme verschiedener Geschwindigkeitsklassen verteilen und gemäß ihrem Wert und ihrer Lesefrequenz auf dem jeweils geeigneten Speichermedium bereitstellen. An der Spitze der Pyramide stehen der Cache sowie Solid State Disks (SSD), ganz unten Disk- oder Bandarchive. Auf diese Weise können auch Governance-, Risk- und Compliance-(GRC)-Anforderungen erfüllt werden.

6. Verfügbarkeit, Business Continuity und Disaster Recovery: Diese drei miteinander verketteten Begriffe dürfen laut Quocirca nicht durcheinandergebracht werden. Die Datenverfügbarkeit ist ein kritischer Faktor, denn ohne Informationen können keine Entscheidungen getroffen oder ERP-Transaktionen durchgeführt werden.

Die Voraussetzung für eine hohe Verfügbarkeit ist ein Business-Continuity-Plan. Dieser soll gewährleisten, dass Endanwender unterbrechungsfrei weiterarbeiten können, selbst wenn eine Systemkomponente wie ein Disklaufwerk oder die Stromversorgung oder komplettes System wie ein Server oder eine Storage-Lösung ausfallen. Sind Rechenzentren redundant ausgelegt und räumlich voneinander getrennt, lassen sich Daten und Systeme aus den Produktivsystemen regelmäßig 1:1 in ein Backup-System im zweiten Rechenzentrum spiegeln. Bei Bedarf wird dann sofort auf das Ersatzsystem umgeschaltet und mit diesem weitergearbeitet.

Durch geschicktes Storage-Tiering können Speicherprozesse nachhaltig optimiert werden.
Foto: STRATO AG

Die Business-Continuity-Strategie wird durch effiziente Backup- und Recovery-Prozesse unterstützt. Ziel muss es sein, den Zustand des Systems unmittelbar vor einem Ausfall wiederherstellen zu können. Dafür gibt es Kenngrößen wie Recovery Point Objective (RPO) und Recovery Time Objective (RTO).

GRC-Anforderungen erfüllen

7. Governance, Risk and Compliance (GRC): Unternehmen müssen beim Informationsmanagement und bei der Datenspeicherung immer mehr gesetzliche und regulatorische Vorgaben erfüllen. Mit einem Informationssicherheits-Managementsystem, das auf dem internationalen Standard ISO/IEC 27001 basiert, lassen sich den Quocirca-Analysten zufolge die Anforderungen an die Informationssicherheit und die Risikoanalyse abbilden.

8. Enterprise Search und Reporting: Das letzte Puzzleteil beim Information Management bildet der Endanwender. Selbst wenn Daten in einer IM-Lösung komplett systemgestützt verwaltet und kontrolliert werden, kann ein Information-Management-Projekt zum Misserfolg verdammt sein; nämlich dann, wenn der End-User die Handhabung der Applikation als umständlich empfindet oder die Performance der Suchfunktionen zu wünschen übrig lässt, was bei Abfragen zu langen Wartezeiten führt. Die Anwendung muss demnach einfach zu bedienen sein, schnelle Antwortzeiten haben und Metadaten- sowie Dokumentenindices vollständig nutzen können. Hinzu kommt, dass Detailinformationen sich sehr feingranular ein- und ausblenden lassen sollten.