Business Continuity

IT-Systeme: Ausfallsicherheit im Kostenvergleich

27.03.2007 von Ulrich Lenz

Der Ausfall wichtiger IT-Systeme kann für ein Unternehmen gravierende Folgen bis hin zur Existenzgefährdung haben. Standby-, Cluster- und fehlertolerante Server bieten Ausfallsicherheit auf verschiedenem Niveau. Allerdings erweisen sich oft preiswerte Lösungen mittelfristig als kostspielig.

Sicherheit gibt es auch in der IT nicht zum Nulltarif. Wer für seine Geschäftsprozesse mehr Verfügbarkeit benötigt, als sie die handelsüblichen Systeme bieten, muss mit höheren Kosten sowohl in der Anschaffung als auch im Unterhalt rechnen. Allerdings kann der Verzicht auf zusätzliche Sicherheit ganz schön teuer werden - wobei den wenigsten Unternehmen bewusst ist, wie viel sie ein auch nur kurzzeitiger Ausfall ihrer Server-Systeme kosten kann.

Oft besteht schon über die wahrscheinlichen Ausfallzeiten der eingesetzten Systeme nur wenig Klarheit. "Normale" Server, also Systeme, die nicht speziell für hohe Zuverlässigkeit getunt sind, erreichen heute eine Verfügbarkeit von rund 99,5 Prozent. Das ist zwar erheblich mehr, als solche Geräte früher erreicht haben, bedeutet aber immer noch eine mittlere jährliche Ausfallzeit (Downtime) von über 40 Stunden. Cluster-Systeme erreichen heute Verfügbarkeitswerte zwischen 99,95 und 99,99 Prozent und fallen damit auch noch bis zu einer Stunde pro Jahr aus.

Systemausfälle und ihre Folgen

Die Kosten von einer Stunde Server-Stillstand hängen stark von der jeweiligen Branche und der Art des jeweiligen Geschäftsmodells ab. Auch in Zeiten vollständiger IT-Durchdringung gibt es natürlich immer noch Tätigkeiten, denen man sich zuwenden kann, solange die IT nicht verfügbar ist: Man kann zum Beispiel ein Meeting einberufen, telefonieren, einen Kunden besuchen, eine Kaffeepause halten und die liegengebliebenen Arbeiten später nachholen.

Ganz anders verhält es sich, wenn die IT die Prozesse nicht unterstützt, sondern sie unmittelbar steuert. Dann steht während einer Downtime beispielsweise die Produktion oder Auslieferung, Artikel kommen nicht aus dem Lager, Kunden können nicht bestellen oder - noch schlimmer - nicht bezahlen. Die Kosten für ausgefallene Arbeitszeit, als Ergebnis von Stundensatz und Zahl der betroffenen Mitarbeiter, können immer nur einen sehr groben Anhaltspunkt liefern, denn meist sind andere Faktoren gravierender: Womöglich sind auch Vertragsstrafen für nicht rechtzeitig erfolgte Lieferungen zu bezahlen, in der Automobilproduktion heute eine gängige Praxis.

Zu den unmittelbaren Ausfallkosten kommen außerdem die schwer zu quantifizierenden Schäden durch Imageverlust wie verärgerte Kunden und Lieferanten.

Je mehr die Geschäftsprozesse von der IT abhängen, desto seltener werden Fälle, in denen der Stillstand des IT-Systems nur geringfügige Folgen hat. Konnte man zum Beispiel vor zehn Jahren in solchen Fällen wenigstens noch telefonieren, so sind heute auch die Vermittlungsstellen in die IT integriert, zugleich hat sich ein Teil der Kommunikation mit E-Mail direkt auf die IT verlagert.

Anfallende Kosten für Downtime (Quelle: Contingency Research)
Branche	Kosten pro Stunde (US-Dollar)

Fertigung	28.000
Logistik	90.000
Einzelhandel	90.000
Home-Shopping	113.000
Medien (Pay per View)	1.100.000
Bankrechenzentrum	2.500.000
Kreditkartenverarbeitung	2.600.000
Broker	6.500.000

In Branchen, in denen das ganze Geschäftsmodell von der IT abhängt, können die Downtime-Kosten enorm hoch werden. So schätzt Contingency Research beispielsweise die Ausfallkosten für das Online-Shopping auf über 100.000 Dollar, für ein Bankrechenzentrum auf 2,5 Millionen Dollar und für das Online-Broking gar auf 6,5 Millionen Dollar – pro Stunde Downtime! Auch wenn die Systeme schnell wieder anlaufen, wäre der Schaden gewaltig, denn schon zehn Minuten Stillstand würden den Online-Broker mehr als eine Million kosten.

Wie hoch die Downtime-Kosten tatsächlich sind, hängt natürlich stark davon ab, wie im Einzelfall die Geschäftsprozesse organisiert sind. Umso bemerkenswerter ist, dass viele Unternehmen die Kosten, die ihnen dabei entstehen, selbst gar nicht kennen. Dies gaben jedenfalls in einer amerikanischen Untersuchung 39 Prozent der befragten IT-Verantwortlichen zu. Wer sich darüber schon Gedanken gemacht hatte, kam teilweise auf recht hohe Werte: Rund ein Drittel rechnete mit Kosten von mehr als 10.000 Dollar, 20 Prozent von ihnen sogar mit über 100.000 Dollar pro Stunde Downtime.

Nicht weniger bemerkenswert ist jedoch, dass hierzulande nicht einmal eine entsprechende Untersuchung vorgenommen wurde. Viele Unternehmen wollen sich von den Folgen eines Systemausfalls offenbar überraschen lassen - ein Standpunkt, der unter den Vorzeichen der derzeit so intensiv geführten Compliance-Diskussion kaum zukunftsfähig ist.

Systemausfall – das unterschätzte Risiko

Nicht überall ist das Risiko eines Systemausfalls eine betriebswirtschaftlich kalkulierbare Angelegenheit. Wo es um Menschenleben geht, etwa in der Flugsicherung, bei Rettungsleitstellen oder im Gesundheitswesen, muss für die Verfügbarkeit das technisch Mögliche um jeden Preis getan werden; dies gilt auch für die Bereiche, wo staatliche Auflagen hochverfügbare Systeme vorschreiben.

Im kommerziellen Einsatz müssen die möglichen Downtime-Kosten den Kosten für hochverfügbare IT-Systeme gegenübergestellt werden. Hochverfügbarkeit war in der Vergangenheit nur durch teure Spezialsysteme, wie zum Beispiel Tandem Himalaya, oder durch proprietäre Lösungen realisierbar. Diese erforderten Investitionen im Millionenbereich und waren im Unterhalt entsprechend teuer. Ihr Einsatz blieb denn auch speziellen Aufgaben vorbehalten und war für kommerzielle Anforderungen meist nicht wirtschaftlich.

Verfügbarkeit auf unterschiedlichem Niveau

Seit Ende der 90er Jahre sind aber auch verstärkt preiswertere Lösungen verfügbar. Sie verwenden verschiedene Technologien, bieten dementsprechend Verfügbarkeit auf unterschiedlichem Niveau und differieren natürlich auch hinsichtlich der Kosten.

Standby-Systeme: Redundante Systeme übernehmen bei Ausfällen wechselseitig die Prozesse. Durch Umschalten und Übergabe der Prozesse sind Ausfallzeiten unvermeidlich, die Konsistenz von Daten und Transaktionen muss separat sichergestellt werden. Erreichbare Verfügbarkeit: 99,5 bis 99,9 Prozent. Das entspricht einer ungeplanten Downtime von bis zu 8,7 Stunden pro Jahr.

Cluster-Systeme: Wichtige Komponenten der Systeme sind redundant ausgelegt. Bei Störungen sorgen spezielle Algorithmen Software-gesteuert für ein Umschalten, dadurch kommt es zu kurzen Ausfallzeiten beziehungsweise zum Verlust offener Transaktionen. Erreichbare Verfügbarkeit: 99,95 bis 99,99 Prozent. Das entspricht bis zu vier Stunden ungeplanter Downtime pro Jahr.

Fehlertolerante Systeme: Sämtliche Komponenten sind redundant ausgelegt, und alle Prozesse laufen parallel, so dass im Störungsfall keine Zeit durch den Wechsel auf funktionierende Komponenten verloren geht. Erreichbare Verfügbarkeit: 99,999 bis 99,9999 Prozent beziehungsweise maximal fünf Minuten ungeplante Downtime pro Jahr.

Durchschnittliche Ausfallzeiten in Abhängigkeit vom Verfügbarkeitsniveau (in Stunden).
Verfügbarkeit (Prozent)	Betriebszeiten 7 x 24 Stunden	Betriebszeiten 7 x 12 Stunden	Betriebszeiten 5 x 12 Stunden

Betriebsstunden pro Jahr	8760	4380	3132
99,00000	87,6000	43,8000	31,3200
99,50000	43,8000	21,9000	15,6600
99,90000	8,7600	4,3800	3,1320
99,95000	4,3800	2,1900	1,5660
99,99000	0,8760	0,4380	0,3132
99,99500	0,4380	0,2190	0,1566
99,99900	0,0876	0,0438	0,0313
99,99990	0,0088	0,0044	0,0031
99,99999	0,0009	0,0004	0,0003

Ausfallsichere Systeme im Kostenvergleich

Auf der Kostenseite sind neben der Beschaffung der Hardware natürlich eine Reihe weiterer Faktoren zu berücksichtigen, so insbesondere die Kosten von Betriebssystem, Datenbanken, Applikationen, Implementierung, Serviceverträgen, Schulungen sowie die Betriebskosten für Administration und so weiter. Entsprechend der technologischen Eigenarten der genannten Systeme schlagen diese Faktoren verschieden zu Buche.

So müssen Applikationen für Cluster-Systeme angepasst werden, damit sie deren Leistungsfähigkeit auch in vollem Umfang nutzen können. Demgegenüber sind Standby-Server mit normaler Software zufrieden. Fehlertolerante Systeme sind seit einiger Zeit auch für die Standard-Betriebssysteme Windows und Linux verfügbar, die entsprechenden Applikationen laufen ohne Änderungen. Insbesondere ist die Implementierung eines Cluster-Systems viel aufwendiger als die eines fehlertoleranten Servers. Dieser ist zwar intern redundant ausgelegt, was für den Anwender jedoch völlig transparent ist – ihm gegenüber präsentiert sich der fehlertolerante Server wie ein Stand-alone-Gerät.

Kostenaufschlüsselung ausfallsicherer Systeme (in Euro)
Komponentenkosten	Standby	Cluster	Fehlertoleranter Server

Hardware	8.000	11.000	33.000
Betriebssystem	5.000	6.000	3.000
Datenbank	10.000	20.000	7.500
Applikation	8.000	8.000	4.000
Implementierung	1.000	9.000	3.000
Test	1.000	10.000	3.000
Schulung	0,00	3.000	0,00
Systemkosten	33.000	67.000	53.500

Laufende Kosten
Support pro Jahr	1.500	5.000	0,00
Service pro Jahr	1.000	12.000	5.000
Laufende Kosten gesamt	2.500	17.000	5.000

Da ein solches System nicht nur virtuell, sondern auch physikalisch ein einziger Rechner ist, benötigt es anders als Standby- oder Cluster-Server auch nur jeweils eine Softwarelizenz, was beispielsweise bei Datenbanken einen wichtigen Kostenfaktor darstellt. Die auf den ersten Blick höheren Anschaffungskosten der fehlertoleranten Systeme gegenüber den Cluster-Servern gleichen sich so bei Einbeziehung sämtlicher Kostenfaktoren wieder aus. Dazu kommt, dass bei Cluster-Systemen Administration, Service und Support deutlich aufwendiger sind, so dass hier mit hohen laufenden Kosten zu rechnen ist.

Jährliche Gesamtkosten für ausfallsichere Systeme (in Euro)
Nutzungszeit	Standby	Cluster	Fehlertoleranter Server

1 Jahr	35.500	84.000	58.500
2 Jahre	19.000	50.500	31.750
5 Jahre	9.100	30.400	15.700

Ausfallkosten im Vergleich

Unterm Strich sind die gesamten Anschaffungs- und Betriebskosten für Standby-Systeme am günstigsten. Hier gibt es ja auch keine technisch abgesicherte Verfügbarkeit, durch das bloße Bereithalten eines zweiten Servers wird ein System nicht hochverfügbar. Fehlertolerante Server erweisen sich bei Berücksichtigung aller Kostenfaktoren erstaunlicherweise schon in der Anschaffung als teurer. Klammert man die besonders kostentreibende Datenbank aus, so liegen diese beiden Alternativen gleichauf, durch die günstigeren laufenden Kosten haben die fehlertoleranten Server, sobald es in den Betrieb geht, die Nase wieder vorn.

Fehlertolerante Systeme im Vergleich (Euro pro Jahr, Nutzungszeit fünf Jahre)
	Standby	Cluster	Fehlertoleranter Server

Verfügbarkeit (Prozent)	99,9	99,95	99,999
Systemkosten (zirka Angaben in Euro)	9.100	30.400	15.700
Downtime-Kosten (zirka Angaben in Euro)	180.000	90.000	2.000

Ob eine solche Investition und Kosten unterm Strich sinnvoll sind, zeigt der Vergleich mit den Kosten eines möglichen Systemausfalls. Pauschalisierte Downtime-Kosten, die für einen direkten Vergleich nötig wären, lassen sich allerdings nur schwer schätzen, weil sie, wie erwähnt, sehr stark von der Branche und vom jeweiligen Unternehmen abhängen. Verwendet man als Hilfsgröße die Kosten einer Industriestunde pro Mitarbeiter (43,50 Euro) und multipliziert diesen Wert mit der Ausfallwahrscheinlichkeit, so ergeben sich für die drei alternativen Lösungen bei 500 Mitarbeitern und einem 7x24-Stunden-Betrieb folgende hypothetische Szenarien:

Ausfallkosten abhängig von Betriebszeiten und Verfügbarkeitsniveau (in Euro, 500 Mitarbeiter, Kosten 42,50 je Stunde)
Verfügbarkeit (Prozent)	Betriebszeiten 7 x 24 Stunden	Betriebszeiten 7 x 12 Stunden	Betriebszeiten 5 x 12 Stunden

99,00000	1.861.500	930.750	443.700
99,50000	930.750	465.375	221.850
99,90000	186.150	93.075	44.370
99,95000	93.075	46.538	22.185
99,99000	18.615	9.308	4.437
99,99500	9.308	4.654	2.219
99,99900	1.862	931	444
99,99990	186,15	93,08	44,37
99,99999	18,62	9,31	4,44

Fazit und Ausblick