Langzeitarchivierung
CDs sind die dümmste Lösung
Bei Nestor arbeiten Vertreter von "Gedächtnisinstitutionen" - Archive, Bibliotheken, Museen, Rechenzentren - unter Federführung der Deutschen Bibliothek in Frankfurt an einem nationalen Konsens zur Organisation der Langzeitarchivierung in der Bundesrepublik. Langfristige Bewahrung heißt dabei für die Archivare die Erhaltung über Generationen von technischen Systemplattformen und Nutzern hinweg. Auf welchem Stand sich die internationale Fachwelt bei der Suche nach langfristigen Aufbewahrungsstrategien befindet, haben Projektmitarbeiter in einem kostenfreien Handbuch "Kleine Enzyklopädie der digitalen Langzeitarchivierung" zusammengefasst.
Auch in wissenschaftlichen Rechenzentren ist Langzeitarchivierung ein großes Thema. Primärdaten aus Studien und Experimenten müssen standardmäßig zehn Jahre aufbewahrt werden. Dies empfehlen die Richtlinien der Deutschen Forschungsgemeinschaft (DFG). "Einzelne Einrichtungen wollen ihre Daten allerdings länger halten - die Unikliniken beispielsweise mindestens 30 Jahre", erklärt Werner Baur, Leiter der Gruppe Datei- und Speichersysteme am Münchner Leibniz-Rechenzentrum (LZR). Das LRZ ist IT-Dienstleister für alle Münchener Hochschulen und kooperiert mit anderen Einrichtungen der öffentlichen Hand wie der Bayerischen Staatsbibliothek, deren Daten es zum Großteil archiviert.
Die Datenmengen, die das LRZ insgesamt verwaltet, sind gigantisch. Ende 2007 wurde laut Baur die 3.000-Terabyte-Grenze überschritten, die Hälfte davon sind Archivdaten. DVDs kommen bei diesen Datenmengen als Speichermedium nicht in Frage, stattdessen archiviert das LRZ auf Magnetbändern. Die hochmoderne Bandtechnologie, die dabei zum Einsatz kommt, ermöglicht die Speicherung von bis zu 1.000 GB auf einem Magnetband. Theoretisch kommen zwar auch Festplatten als Datenträger in Frage. "Das ist allerdings von den Energiekosten her bei unseren Datenmengen nicht effizient genug - ein wichtiges Argument in einer Zeit, in der Green IT in aller Munde ist", gibt Baur zu bedenken.
Neue Datenträger braucht das Land
Die Verwaltung der Archivdaten erfolgt mit einer speziellen Software, dem Tivoli StorageStorage Manager von IBMIBM. Damit lassen sich verschiedene Policies definieren: Wie lange werden welche Daten aufbewahrt? Wie viele Versionen soll es geben? Wann werden sie gelöscht? "Wir haben vorgegebene Default-Einstellungen, etwa, dass die Daten zehn Jahre archiviert werden", sagt Baur. "Wenn unsere Kunden andere Anforderungen haben, vereinbaren wir individuelle Regeln. Die Daten werden dann anderen Management-Klassen zugeordnet." Alles zu IBM auf CIO.de Alles zu Storage auf CIO.de
Um digitale Daten über Jahrzehnte hinweg zu erhalten, sieht das LRZ nur eine praktikable Lösung: Die Informationen müssen nach einigen Jahren auf neue Datenträger migriert werden. Mehr als fünf Jahre werden die Daten in der Regel am LRZ nicht auf dem gleichen Medium gehalten. Mit dieser Strategie senkt das LRZ die Wahrscheinlichkeit, dass Daten infolge mangelnder Haltbarkeit des Datenträgers verloren gehen. Und vor allem: Man bleibt auf dem aktuellen Stand der Technik, was die Lesegeräte betrifft.