Server virtualisiert

Nationalbibliothek: Bücher on Demand

27.02.2012 von Johannes Klostermeier
Die Deutsche Nationalbibliothek archiviert jetzt mit einem neuen IBM-Storagesystem die Werke großer Dichter – und Neue Medien.

Die Deutsche Nationalbibliothek in Frankfurt am Main archiviert ihre gesammelten Publikationen jetzt auf einem IBM Scale Out Network Attached Storage (SONAS)-Speichersystem. Das teilte das Unternehmen mit. Besonders für die digitalen Medien biete die Lösung genügend Speicherplatz. Zudem reduzierten sich dadurch die Zeit, die Kosten und die Risiken beim Abrufen der archivierten Medien.

Mehr Speicher für die Schätze der Deutschen Nationalbibliothek in Frankfurt am Main.
Foto: www.designtorget.se

Die Deutsche Nationalbibliothek hat die Aufgabe, als einzige Institution in Deutschland, lückenlos alle deutschen und deutschsprachigen Publikationen ab 1913 zu sammeln. Sie archiviert diese dauerhaft, verzeichnet sie bibliografisch und stellt sie der Öffentlichkeit zur Verfügung.

Ein zentraler Bestandteil der Sammlung ist der Bereich Neue Medien, wie zum Beispiel CDs, die sich ständig vergrößert. So digitalisieren die Mitarbeiter der Bibliothek derzeit einen Bestand von 400.000 bis 500.000 CDs.

Das stellte die Deutsche Nationalbibliothek jedoch zunehmend vor Probleme beim Speicherbedarf. Bereits Ende 2011 wurde hier eine Datenmenge von 40 bis 50 Terabyte benötigt. Der Bestand der digitalen Medien, die viel Speicherbedarf erfordern, wächst stetig.

Mit IBM Scale Out Network Attached Storage (SONAS) können die Daten in einem einzigen Filesystem gespeichert werden.
Foto: IBM

Damit die Deutsche Nationalbibliothek auch langfristig ihrem Sammelauftrag nachkommen kann, benötigt sie eine Infrastruktur mit der sich digitale Publikationen einfach speichern und bereitstellen lassen. Die Nationalbibliothek hat sich jetzt dazu entschlossen die Speicherlösung IBM Scale Out Network Attached Storage (SONAS) einzuführen. Dadurch können die Daten in einem einzigen Filesystem gespeichert werden.

Server für Verwaltungsdaten und Dokumente virtualisiert

Der IBM-Geschäftspartner Bechtle hatte dabei die Aufgabe, das Projekt gemeinsam mit der Deutschen Nationalbibliothek zu planen und die passenden Produkte auszuwählen. In einem ersten Schritt wurden die Server für die Verwaltungsdaten und Dokumente virtualisiert, damit die Mitarbeiter unabhängig von den digitalen Publikationen darauf zugreifen können.

Eine weitere wichtige Komponente ist das Backup der Daten, das durch den IBM Tivoli Storage Diskpool (TSM) gewährleistet werden soll. So werden die Daten dupliziert und mit einem vorgelagerten Diskpool auf Band gespeichert. Als zweite Kernkomponente der Datensicherung verfügt die Nationalbibliothek mit IBM GPFS (General Parallel File System) über ein Filesystem, mit dem sich auch ein Datenaufkommen im Petabyte-Bereich bewältigen ließe.

Daten-Backup auf Bändern

Zusätzlich können die Mitarbeiter laut IBM innerhalb weniger Minuten erkennen, welche Daten sich in den letzten zwei Wochen geändert haben und welche neu dazugekommen sind, um diese zu sichern. Anschließend wird der Tivoli Storage Diskpool durch die enge Integration mit dem General Parallel File System mit diesen Daten gefüttert.

Eine wichtige Rolle spielt die Sicherheit bei der Archivierung der Daten. Die Verantwortlichen der Deutschen Nationalbibliothek haben sich hier für ein Daten-Backup auf Bändern entschieden.

Mitarbeiter kopieren die Daten und tauschen diese Kopien zwischen den Standorten Leipzig und Frankfurt aus. So sind sie auch im Katastrophenfall nochmal als Backup an einem anderen Ort gelagert. Außerdem greifen die Nutzer in den Lesesälen der Bibliothek aus Sicherheitsgründen niemals direkt, sondern immer mittels vorgeschalteter Applikationen auf das System IBM SONAS zu.

Problem: Migration der optischer atenträger

Eine Herausforderung neben der Migration weiterer elektronischer Publikationen, die auf verteilten kleinen Altsystemen und einem zehn Jahre alten Deposit-Server lagerten, war die Migration von optischen Datenträgern.

Auch die Nutzer profitieren von der neuen Lösung. CDs können sie sich jetzt einfacher anhören.
Foto: Fotolia, M. Ruiz

„Unsere Mitarbeiter digitalisieren und speichern Audio-CDs und weitere Audiomedien ad hoc und im Bedarfsfall vor Ort. Hier und bei der Massenmigration von CDs kommt uns die neue Speicherlösung zu Gute. Gleichzeitig können so nun die täglich über die Repository-Software eingehenden Daten und Netzpublikationen gesichert und zugänglich gemacht werden", sagte Reinhard Altenhöner, Abteilungsleiter Informationstechnik bei der Deutschen Nationalbibliothek. „Besonders unsere Nutzer profitieren von der neuen Lösung. Sie können nun einfach eine CD auswählen und diese direkt über ein Audiosystem anhören."