Das Berliner Olympiastadion, das Königliche Theater in Kopenhagen, das Nobelhotel Carlton in St. Moritz - alle strahlen im Licht der Experten aus Dornbirn in Österreich. Für die IT-ler bei Zumtobel bedeutet die lange Liste an Referenzen: Architekten und andere Projektbeteiligte aus aller Welt greifen in Echtzeit auf Backend-Systeme wie SAP oder Produktdatenbanken zu. "Die E-Business-Plattform ist unser Brot-und-Butter-Geschäft", sagt Tom Brady, CIO der Zumtobel Group. "Die Nutzer erwarten Online-Services auf höchstem Niveau. Wenn wir die nicht bieten können, gehen uns Umsätze und schlimmstenfalls auch Kunden verloren."
Die E-Business-Plattform bietet folglich mehr als den aktuellen Produktkatalog. Immer wichtiger werden der Zugriff auf Planungs- und Produktunterlagen und die Visualisierung von Referenzprojekten. Seit Kurzem stehen diese auch als App für iPhone und iPad zur Verfügung. Mit jeder neuen Anwendung und jedem zusätzlichen Nutzer steigen jedoch die Anforderungen; zusätzlich sorgen Produktneuheiten jeweils im März und Oktober für erhebliche Lastspitzen.
Zwei Ziele hatte CIO Brady deshalb bei der 2010 fälligen Vertragsverlängerung für die neue Infrastrukturlösung: Auf der einen Seite sollte die Umgebung deutlich an Flexibilität gewinnen, um die starken saisonalen Schwankungen abzufedern. Auf der anderen Seite erwartete er eine merkliche Senkung der Betriebskosten. "Nach Übernahme des CIO-Postens im September 2009 bin ich erst einmal alle Verträge durchgegangen", blickt Brady zurück. "Dabei wurde sofort klar: In mehr als 60 Servern mit Dutzenden von Anwendungen musste einfach Potenzial für Optimierungen stecken."
Server hatten ohnehin ausgedient
Eine detaillierte Analyse bot das gleiche Bild wie in fast allen Rechenzentren: Während einige Server kaum ausgelastet vor sich hindümpelten, waren andere so überlastet, dass ständig Hardwareaufrüstungen fällig wurden. Seit 2006 ist der Betrieb der Portalumgebung bereits an Arago ausgelagert. Der Rechenzentrumsexperte aus Frankfurt ist auf Entwicklung, Hosting und Automatisierung von Business-Applikationen spezialisiert und betreibt die Zumtobel-Infrastruktur auf angemieteten RZ-Flächen bei der Telekom Austria in Bregenz. Arago hat jetzt auch die neue Hybrid-Cloud-Lösung konzipiert und umgesetzt.
Die Lösung für das Problem sollte eine vollständig virtualisierte Cloud-Umgebung bringen. Im Gegensatz zur "einfachen Virtualisierung", die mehrere virtuelle Server fest auf einem physischen Server zusammenlegt, sollten sämtliche Ressourcen vollständig dynamisch in einer Cloud zugewiesen werden. Gerade im E-Business-Umfeld, wo oftmals kurzfristig skaliert werden muss oder temporär weitere Applikation hinzukommen, kann die Begrenzung auf einzelne physische Systeme zum Hemmschuh werden, selbst wenn diese virtualisiert sind.
Deshalb wurden alle physischen Server in einer Cloud zusammengefasst. Solange in Summe noch genügend Ressourcen zur Verfügung stehen, kann jede neue virtuelle Datenbank- oder Applikations-Server-Instanz sofort gestartet werden, ohne festzulegen, auf welcher Maschine die Anwendung laufen soll.
Nachdem die Grundsatzentscheidung für die Cloud gefallen war, begann das Projekt im Frühjahr 2010 mit einer Bestandsaufnahme der vorhandenen Server mit ihren CPUs, Speichern und allen weiteren Performance-relevanten Komponenten. Weil nach fünfjährigem Betrieb ohnehin die Ablösung der vorhandenen Server anstand, konnte die neue Server-Landschaft frei von Altlasten geplant werden. Die neue Hardware-Landschaft ist mit einiger zusätzlicher Sicherheit dimensioniert. Anstelle der ehemals 62 Server stehen jetzt neun Dell-R710-Server mit Equalogic-PS6000-Storage-Systemen in nur noch zwei Racks im Rechenzentrum. "Die nicht mehr benötigte Stellfläche konnten wir sofort an die Telekom Austria zurückgeben - vorher standen dort 16 Racks", erinnert sich Arago-Projektleiter Thorsten Hilger.
Nach den Berechnungen soll sich die Neuanschaffung im Vergleich zur bisher eingesetzten Server-Landschaft innerhalb weniger Jahre allein durch die Ersparnis an Rechenzentrumsfläche, Strom und Kühlung amortisieren. Zudem entfallen die zusätzlichen Ausgaben für Ausfallsicherheit, die in klassischen IT-Systemen merklich zu Buche schlagen. Denn neben der automatischen Lastverteilung bringt die Cloud-Infrastruktur gleichsam automatisch Ausfallsicherheit mit: Falls eine physische Maschine ausfällt, werden die virtuellen Maschinen ohne manuellen Eingriff auf eine andere physische Maschine in der Cloud migriert - ohne dass Kosten für gespiegelte oder geclusterte Hardware anfallen.
Aber auch die neue Server-Landschaft hat nur endliche Ressourcen. Der entscheidende Zugewinn an Flexibilität entsteht erst aus dem Konzept der Hybrid Cloud: Lastspitzen werden durch kurzfristig hinzugebuchte Kapazitäten aus der Public Cloud abgefedert. Damit stehen - zumindest theoretisch - unbegrenzte Ressourcen zur Verfügung. Aber auch in der Realität gibt es eine hinreichende Auswahl: Neben den RZ-Kapazitäten im Arago-eigenen hochsicheren Rechenzentrum in Frankfurt und der lokalen Telekom Austria stehen auch Ressourcen internationaler Cloud-Provider bereit. Arago hat Vereinbarungen mit T-Systems, Colt und Verizon getroffen, sodass jederzeit Rechen- und Speicherkapazität zugeschaltet und - teilweise sogar minutengenau - abgerechnet werden können.
Auch wenn die Lösung sofort einleuchtend und einfach klingt: Das Management, die Zuteilung der Ressourcen und die Lastverteilung in der dynamischen IT-Infrastruktur stellen höhere Anforderungen als die klassischen IT-Landschaften und sind manuell ohne ausgefeilte Automatisierungsmechanismen nicht mehr zu bewerkstelligen: "Der Administrationsaufwand für eine sich solchermaßen dynamisch verändernde IT-Umgebung wie die Cloud kann nicht mehr mit herkömmlichen Werkzeugen allein erbracht werden", erläutert Arago-Projektleiter Hilger. "Für den Betrieb von Cloud-Infrastrukturen haben wir eine Software entwickelt, die neben reinen Administrations- und Automatisierungsfunktionen auch Wissensbausteine für die Cloud-Optimierung integriert."
Selbstlernender Autopilot
Basis der eingesetzten Management-Software "Arago Autopilot for IT Operations" sind ein Regel-Pool für die Ablage der Erfahrungen rund um die Bearbeitung von Vorfällen sowie ein IT-Modell, das die Abhängigkeiten zwischen der IT und den Services dokumentiert. So ist der Autopilot "selbstlernend" in der Lage, den dynamischen Veränderungen in der IT-Infrastruktur zu folgen und den Großteil der Administration ohne manuellen Eingriff eigenständig zu erledigen.
Nach sechsmonatiger Projektdauer waren alle Systeme auf die Cloud migriert. Auf Zumtobel-Seite waren das zehn Personen umfassende Basisbetriebsteam sowie das Entwicklungsteam mit 15 teilweise externen Mitarbeitern beteiligt, die sechsköpfige Arago-Truppe führte Projektleiter Thorsten Hilger an. "Die Vorteile hinsichtlich der Kosten, bezüglich Green IT und vor allem, die Kapazität nach Bedarf aus-, aber auch wieder abbauen zu können, waren absolut einleuchtend", sagt CIO Brady. In weniger als einem Jahr will er den Return on Investment bei den Hardwarekosten geschafft haben. Die wichtigste Messlatte blieb für ihn dennoch die Systemleistung. Und auch hier sieht er seine Erwartungen bestätigt: Trotz des erheblichen Downsizings der Server-Landschaft ergaben die ersten Messungen eine merkliche Performance-Steigerung für die rund 1700 Mitarbeiter in 50 Ländern sowie externe Geschäftspartner. "Das Feedback zur Performance ist sehr, sehr gut", freut sich der CIO.
Der Ernstfall - die Zuschaltung externer Ressourcen aus der Public Cloud - ist allerdings bisher noch nicht eingetreten. Als erster Termin dafür war die Bilanzpressekonferenz im März geplant. Aber wider Erwarten hielten die eigenen Hardwareressourcen den hohen Leistungsanforderungen durch internationale Video-Streamings stand. "Wir haben das vorher natürlich ausgiebig getestet und auch mehrere interne Server ausgeschaltet", versichert Arago-Mann Hilgert. Wenn nichts Unvorhergesehenes geschieht, kommt der nächste, echte Stresstest wohl erst im Oktober auf CIO Brady zu. Bei der Präsentation der Produktneuheiten plagen ihn jedoch keine Zweifel: „Ich habe das ja im Test gesehen und bin völlig sicher, dass das Zuschalten von CPU und Speicher auch im Ernstfall funktioniert."