"Ich glaube, am Anfang des Projektes hat uns niemand zugetraut, dass wir das schaffen," erinnert sich Eon-CIO Sebastian Weber an den Start der groß angelegten Cloud-Migration des Energieversorgers 2021. Die Initiative war Teil eines übergreifenden Digitalisierungsprogramms. (Lesen Sie mehr dazu im Artikel "Führen aus dem IT-Keller zur Transformation")
Praxis statt Powerpoint
Die Idee, die Rechenzentren abzuschalten, geistere bereits länger durch die IT-Planungsmeetings. Weber räumt ein: "Bei dem Cloud-Thema haben wir schon einige Jahre in Powerpoint verbracht. Wir haben es immer wieder theoretisch durchdrungen." Allerdings: Je tiefer man eintauchte, desto komplexer sei es erschienen, sodass bis zu seinem Amtsantritt 2021 noch nichts umgesetzt war.
Für mehr spannende Strategien, Hintergründe und Deep Dives aus der CIO-Community, abonnieren Sie unsere CIO-Newsletter.
Das lag unter anderem an dem Umfang eines solchen Projekts. Zwar war die digitalisierte Operational Technology (OT), etwa Digital Twins von Leitständen, von dem Projekt ausgenommen, da sie als kritische Infrastruktur eingestuft ist. Die restliche IT-Landschaft hatte jedoch immer noch gigantische Ausmaße. Weber: "Alle Abrechnungssysteme oder auch Datenübertragungssysteme an den Regulator laufen in der IT, was die Cloud-Migration zu einem wahren Mammut-Projekt machte."
Der IT-Chef wählte daher einen anderen Weg. "Ich habe 2021 gesagt, wir sind in drei Jahren aus den eigenen Rechenzentren raus, wir fangen jetzt an und migrieren in einem Lift-and-shift-Ansatz," skizziert Weber seine damalige Vision.
Gegen alle Erwartungen
Weber wollte nicht erst Jahre lang die Modernisierung planen, um das ideale Cloud-Zielbild zu erreichen: "Erst migrieren und den Großteil der Modernisierung hinterher machen," lautete stattdessen das Credo des CIOs.
Diese Herangehensweise wurde von einer Auswertung der größten IT-Vorfälle unterstützt: "Ein Großteil der Downtimes, die wir erlebten, hingen mit einem Rechenzentrum zusammen, das der Zeit nicht mehr gewachsen war," erinnert sich Weber.
Das begünstigte den Lift-and-Shift-Ansatz. "Unsere Strategie war: wenn wir von alter auf neue Hardware, von dem eigenen Rechenzentrum auf ein redundanteres Cloud-Rechenzentrum mit besseren Latenzzeiten wechseln, haben wir schon gewonnen," so der CIO.
Eon setzt dabei auf eine Multi-Cloud. Der größte Anteil der IT ist auf Microsoft Azure gehostet, da die Redmonder die initiale Ausschreibung für den Infrastructure-as-a-Service- (IaaS-)Bestandteil der Cloud-Migration gewonnen hatten. Darüber hinaus kommen AWS und Google mit Cloud-Tranchen zum Zug.
Die AWS-Instanzen stammen größtenteils aus Mergern, Zukäufen und der Integration der Innogy. Diese wurden beibehalten und auch ausgebaut, um ein Spannungsfeld aufrecht zu erhalten. Google Cloud bildet den kleinsten Teil und konzentriert sich hauptsächlich auf Entwicklungsumgebungen, IoT-Lösungen und das Data-Umfeld.
Verantwortung richtig verteilen
Es dauerte sechs Monate, bis das Projekt tatsächlich ins Rollen kam, denn auch die IT-Organisation musste angepasst werden. "Eon hatte ein Transformations-Programm ins Leben gerufen, dass mit der Migration betraut war. Da passierte aber lange nichts," berichtet Weber rückblickend.
Das Problem laut dem IT-Chef war, dass dieses Transformations-Programm im Grunde konträr zu den bestehenden Unternehmensstrukturen lief. Die für die Rechenzentren verantwortliche Linienorganisation habe in dieser Konstellation nur verlieren können, weil ihnen die Rechenzentren genommen wurden.
Also verschob Weber die Verantwortung: "Ich habe die Linienleitung der Rechenzentren direkt mit dem Projekt betraut. Es gab kein Programm mehr, sondern nur noch die Aufgabe, alles in die Cloud zu befördern, und die lag in der Hand derjenigen, die es direkt betraf."
Das sei zu Anfang ein Schock für die Kolleginnen und Kollegen in der Linie gewesen. Weber: "Aber dann kam die Erkenntnis, dass sie ihre Zukunft mitgestalten können, dass sie keine technologische 'Bad Bank' sind, sondern aktiv an der Modernisierung beteiligt sind." Das habe die Sichtweise geändert und die Teammitglieder hätten sich aktiv für den Wechsel engagiert. "Rückblickend erscheint das alles logisch, aber zu dem Zeitpunkt war uns das nicht bewusst und hat uns ein halbes Jahr gekostet," resümiert der CIO.
Oberste Regel: Cool bleiben
Anschließend ging es an die Migration der Anwendungen. Das sei ein langwieriger Prozess gewesen. Weber griff in dieser Zeit auf bewährte Management-Kniffe zurück: "Da muss man cool bleiben, das Projekt weiter durchziehen und das Team loben."
Eineinhalb Jahre später waren die größten SAP-Systeme aus dem Data Center in die Cloud migriert. Das sei einer der Momente gewesen, in denen das Business realisiert habe, dass die IT das Richtige tut.
Zudem waren erste Erfolge vorzuweisen: Mit fortschreitender Migration gab es laut Weber weniger Vorfälle und sein Team konnte die Ausfällzeiten auf den Kritikalitäts-Leveln eins und zwei um 70 Prozent reduzieren. "Das liegt daran, dass die Wiederherstellungszeiten deutlich kürzer sind," erklärt der Manager und ergänzt: "Ich kann in der Cloud mit Geld ein Problem erschlagen und etwa sofort eine zweite Umgebung aufbauen oder schnell Volumen nachschalten, das war vorher im Rechenzentrum nicht möglich."
Zudem wurden Abläufe und Abstimmungsprozesse innerhalb des Teams angepasst. Weber: "Wir sammeln Learnings, messen bei jedem Vorfall, was die Muster sind, was sich wiederholt und was nicht, und haben Dependency-Maps aufgebaut."
"Wir haben noch viele Legacy-Apps in der Cloud, die modernisiert und IP-Netzwerke, die verschlankt werden müssen - aber das geht in der Cloud, etwa mit flexiblen Ressourcen und virtuellen Netzwerken, viel leichter als vorher im Rechenzentrum," konstatiert Weber. Diese Hausaufgaben begann sein Team bereits 2023 umzusetzen. "Da stellten auch die letzten Zweifler fest, dass Modernisieren in der Cloud von der Konsole aus deutlich einfacher und schneller geht als im Rechenzentrum."
Die eigenen Leute an die Cloud lassen
Als dritte Drehschraube neben der Technik und der Organisation widmete sich Weber dem Zusammenspiel zwischen Eon und den Hyperscalern. Der CIO findet dafür klare Worte: "Ich brauche keinen Managed-Service-Partner, der für mich die Cloud verwaltet, ich kann selbst den Knopf auf dem Dashboard drücken, um eine neue Maschine hochzufahren, dafür brauche ich kein Ticket aufmachen."
Zudem biete die Cloud zahlreiche Automatisierungsmöglichkeiten, die sich mit klassischen Outsourcing-Verträgen beißen würden. Viele traditionelle Dienstleister-Aufgaben im Rechenzentrum ließen sich in der Cloud mit Skripten automatisieren.
So kämen mehr Teams direkt mit der Cloud und nicht mit einem Ticket-System in Kontakt. Das schaffe Vertrauen und Engagement für die Transformation im Team. Daher wolle Eon alle Dienstleister-Verträge entsprechend anpassen. "Es wird nur noch für Einzelvolumina klassisches Outsourcing geben. Bei kritischen Angelegenheiten gibt es jetzt immer ein Dreigespann: Wir, die Cloud und ein Berater, der uns hilft, aber nicht komplett abkapselt," erklärt der IT-Chef.
Dafür bildet Eon seine Belegschaft weiter und heuert viele neue Talente an. Weber: "Letztes Jahr haben wir 400 neue Mitarbeiterinnen und Mitarbeiter eingestellt und weitere 600 Planstellen können besetzt werden." Der Schritt in die Cloud habe einen Wandel bei der Eon-IT ermöglicht, die Teams umzustellen und sie in die Lage versetzt, die IT selbst zu managen.
Sand im Migrationsgetriebe
Es lief jedoch nicht alles rund, wie Weber einräumt: "Vieles wurde über die letzten Jahre nicht ausreichend dokumentiert. Auch nach dem Umzug in die Cloud gab es noch laufende Maschinen im Einsatz, von denen wir nicht wissen, was sie tun. Also müssen wir demnächst mal diese Rechner ausschalten und schauen, ob irgendjemand anruft."
Weiterhin sei schwierig gewesen, dass Applikationen nicht einfach aus dem Data Center in die Cloud geschoben werden konnten - vor allem wegen der Verknüpfung und Kommunikation mit anderen Anwendungen. Laut dem IT-Chef hätten Latenzzeiten nicht mehr gepasst, wenn zwei verbundene Apps mit einem Mal nicht mehr im selben Rack zusammengeschaltet waren.
Also musste das Team um Weber Verbünde herstellen. Dazu wurde eine Software installiert, die über Monate IP-Traffic im Rechenzentrum beobachtet hat. Daraus wurden Kommunikationsmuster der einzelnen Server und Anwendungen erstellt, um Migrations-Cluster aufzubauen. Diese so bestimmten Kombinationen an Systemen habe man dann im nächsten Schritt gesammelt migriert.
Der Super-GAU
Aber auch das hatte seine Tücken. Einen großen SAP-Verbund hatte die Eon-IT erstaunlich reibungslos über den Sommer 2022 in die Cloud migriert. Doch Ende Oktober stand das System plötzlich still.
"Auslöser war ein Ausfall auf Seiten Microsofts. Aber wir hatten eigentlich erwartet, dass sich die Systeme resilienter verhalten," berichtet Weber. Was die IT bemerkte: Im November 2022 gab es immer noch Abhängigkeiten zum Rechenzentrum für Failover-Prozesse von Applikationen.
So verlor Eon zusätzlich Zeit, weil mit der Cloud auch Anwendungen im alten Rechenzentrum betroffen waren, die erst zu diesem Zeitpunkt erkannt wurden. Weber: "Wir hatten, vereinfacht ausgedrückt, Datenpakete, die in Endlosschleife ins Netzwerk rauschten, solange bis alles stillgestanden hat."
Bei einem solchen Vorfall hätte es viel Unsicherheit in IT und Business geben können, ob die Cloud tatsächlich die richtige Strategie sei. Zumal die IT nicht genau sagen konnte, wie lange der Vorfall dauern würde. Aber die Fakten sprachen laut Weber für sich: "In der alten Rechenzentren-Welt hätte das Business doppelt so lange stillgestanden, wenn eine Festplatte im Rechenzentrum ausgefallen wäre."
Lessons Learned
Weber hat einige Lehren aus den letzten drei Jahren mitgenommen. Die wichtigste lautet: Ins Doing kommen. "Häufig ist Lift-and-shift der richtige Ansatz. Damit schafft man den ersten wichtigen Schritt nach vorne. Der entspricht vielleicht nicht dem Idealbild, aber die Sache kommt ins Rollen."
Zudem gilt es, eine nahe, echte Deadline sowie ambitionierte Ziele vorzugeben und hinter ihnen zu stehen. Weber: "Wenn da eine Deadline bis 2030 drinsteht, dann passiert nichts."
Darüber hinaus müssen die Menschen, die es betrifft, sich selbst transformieren. Ein paralleles Programm schafft Ablehnung. Stehen die Kolleginnen und Kollegen dagegen selbst in der Verantwortung, sind sie aktiv, animiert und motiviert, die Reise auch mitzugestalten.
Als letztes sei es ratsam, die Ownership des Projekts beim Unternehmen zu behalten. Weber: "Klar haben wir Partner mitgenommen, ohne die hätten wir es nicht geschafft, aber am Ende des Tages migrieren wir und nicht der Dienstleister."