Business Continuity

IT-Systeme: Ausfallsicherheit im Kostenvergleich

27.03.2007 von Ulrich Lenz
Der Ausfall wichtiger IT-Systeme kann für ein Unternehmen gravierende Folgen bis hin zur Existenzgefährdung haben. Standby-, Cluster- und fehlertolerante Server bieten Ausfallsicherheit auf verschiedenem Niveau. Allerdings erweisen sich oft preiswerte Lösungen mittelfristig als kostspielig.

Sicherheit gibt es auch in der IT nicht zum Nulltarif. Wer für seine Geschäftsprozesse mehr Verfügbarkeit benötigt, als sie die handelsüblichen Systeme bieten, muss mit höheren Kosten sowohl in der Anschaffung als auch im Unterhalt rechnen. Allerdings kann der Verzicht auf zusätzliche Sicherheit ganz schön teuer werden - wobei den wenigsten Unternehmen bewusst ist, wie viel sie ein auch nur kurzzeitiger Ausfall ihrer Server-Systeme kosten kann.

Oft besteht schon über die wahrscheinlichen Ausfallzeiten der eingesetzten Systeme nur wenig Klarheit. "Normale" Server, also Systeme, die nicht speziell für hohe Zuverlässigkeit getunt sind, erreichen heute eine Verfügbarkeit von rund 99,5 Prozent. Das ist zwar erheblich mehr, als solche Geräte früher erreicht haben, bedeutet aber immer noch eine mittlere jährliche Ausfallzeit (Downtime) von über 40 Stunden. Cluster-Systeme erreichen heute Verfügbarkeitswerte zwischen 99,95 und 99,99 Prozent und fallen damit auch noch bis zu einer Stunde pro Jahr aus.

Systemausfälle und ihre Folgen

Die Kosten von einer Stunde Server-Stillstand hängen stark von der jeweiligen Branche und der Art des jeweiligen Geschäftsmodells ab. Auch in Zeiten vollständiger IT-Durchdringung gibt es natürlich immer noch Tätigkeiten, denen man sich zuwenden kann, solange die IT nicht verfügbar ist: Man kann zum Beispiel ein Meeting einberufen, telefonieren, einen Kunden besuchen, eine Kaffeepause halten und die liegengebliebenen Arbeiten später nachholen.

Ganz anders verhält es sich, wenn die IT die Prozesse nicht unterstützt, sondern sie unmittelbar steuert. Dann steht während einer Downtime beispielsweise die Produktion oder Auslieferung, Artikel kommen nicht aus dem Lager, Kunden können nicht bestellen oder - noch schlimmer - nicht bezahlen. Die Kosten für ausgefallene Arbeitszeit, als Ergebnis von Stundensatz und Zahl der betroffenen Mitarbeiter, können immer nur einen sehr groben Anhaltspunkt liefern, denn meist sind andere Faktoren gravierender: Womöglich sind auch Vertragsstrafen für nicht rechtzeitig erfolgte Lieferungen zu bezahlen, in der Automobilproduktion heute eine gängige Praxis.

Zu den unmittelbaren Ausfallkosten kommen außerdem die schwer zu quantifizierenden Schäden durch Imageverlust wie verärgerte Kunden und Lieferanten.

Je mehr die Geschäftsprozesse von der IT abhängen, desto seltener werden Fälle, in denen der Stillstand des IT-Systems nur geringfügige Folgen hat. Konnte man zum Beispiel vor zehn Jahren in solchen Fällen wenigstens noch telefonieren, so sind heute auch die Vermittlungsstellen in die IT integriert, zugleich hat sich ein Teil der Kommunikation mit E-Mail direkt auf die IT verlagert.

Anfallende Kosten für Downtime (Quelle: Contingency Research)

Branche

Kosten pro Stunde (US-Dollar)

Fertigung

28.000

Logistik

90.000

Einzelhandel

90.000

Home-Shopping

113.000

Medien (Pay per View)

1.100.000

Bankrechenzentrum

2.500.000

Kreditkartenverarbeitung

2.600.000

Broker

6.500.000

In Branchen, in denen das ganze Geschäftsmodell von der IT abhängt, können die Downtime-Kosten enorm hoch werden. So schätzt Contingency Research beispielsweise die Ausfallkosten für das Online-Shopping auf über 100.000 Dollar, für ein Bankrechenzentrum auf 2,5 Millionen Dollar und für das Online-Broking gar auf 6,5 Millionen Dollar – pro Stunde Downtime! Auch wenn die Systeme schnell wieder anlaufen, wäre der Schaden gewaltig, denn schon zehn Minuten Stillstand würden den Online-Broker mehr als eine Million kosten.

Wie hoch die Downtime-Kosten tatsächlich sind, hängt natürlich stark davon ab, wie im Einzelfall die Geschäftsprozesse organisiert sind. Umso bemerkenswerter ist, dass viele Unternehmen die Kosten, die ihnen dabei entstehen, selbst gar nicht kennen. Dies gaben jedenfalls in einer amerikanischen Untersuchung 39 Prozent der befragten IT-Verantwortlichen zu. Wer sich darüber schon Gedanken gemacht hatte, kam teilweise auf recht hohe Werte: Rund ein Drittel rechnete mit Kosten von mehr als 10.000 Dollar, 20 Prozent von ihnen sogar mit über 100.000 Dollar pro Stunde Downtime.

Nicht weniger bemerkenswert ist jedoch, dass hierzulande nicht einmal eine entsprechende Untersuchung vorgenommen wurde. Viele Unternehmen wollen sich von den Folgen eines Systemausfalls offenbar überraschen lassen - ein Standpunkt, der unter den Vorzeichen der derzeit so intensiv geführten Compliance-Diskussion kaum zukunftsfähig ist.

Systemausfall – das unterschätzte Risiko

Nicht überall ist das Risiko eines Systemausfalls eine betriebswirtschaftlich kalkulierbare Angelegenheit. Wo es um Menschenleben geht, etwa in der Flugsicherung, bei Rettungsleitstellen oder im Gesundheitswesen, muss für die Verfügbarkeit das technisch Mögliche um jeden Preis getan werden; dies gilt auch für die Bereiche, wo staatliche Auflagen hochverfügbare Systeme vorschreiben.

Im kommerziellen Einsatz müssen die möglichen Downtime-Kosten den Kosten für hochverfügbare IT-Systeme gegenübergestellt werden. Hochverfügbarkeit war in der Vergangenheit nur durch teure Spezialsysteme, wie zum Beispiel Tandem Himalaya, oder durch proprietäre Lösungen realisierbar. Diese erforderten Investitionen im Millionenbereich und waren im Unterhalt entsprechend teuer. Ihr Einsatz blieb denn auch speziellen Aufgaben vorbehalten und war für kommerzielle Anforderungen meist nicht wirtschaftlich.

Verfügbarkeit auf unterschiedlichem Niveau

Seit Ende der 90er Jahre sind aber auch verstärkt preiswertere Lösungen verfügbar. Sie verwenden verschiedene Technologien, bieten dementsprechend Verfügbarkeit auf unterschiedlichem Niveau und differieren natürlich auch hinsichtlich der Kosten.

Standby-Systeme: Redundante Systeme übernehmen bei Ausfällen wechselseitig die Prozesse. Durch Umschalten und Übergabe der Prozesse sind Ausfallzeiten unvermeidlich, die Konsistenz von Daten und Transaktionen muss separat sichergestellt werden. Erreichbare Verfügbarkeit: 99,5 bis 99,9 Prozent. Das entspricht einer ungeplanten Downtime von bis zu 8,7 Stunden pro Jahr.

Cluster-Systeme: Wichtige Komponenten der Systeme sind redundant ausgelegt. Bei Störungen sorgen spezielle Algorithmen Software-gesteuert für ein Umschalten, dadurch kommt es zu kurzen Ausfallzeiten beziehungsweise zum Verlust offener Transaktionen. Erreichbare Verfügbarkeit: 99,95 bis 99,99 Prozent. Das entspricht bis zu vier Stunden ungeplanter Downtime pro Jahr.

Fehlertolerante Systeme: Sämtliche Komponenten sind redundant ausgelegt, und alle Prozesse laufen parallel, so dass im Störungsfall keine Zeit durch den Wechsel auf funktionierende Komponenten verloren geht. Erreichbare Verfügbarkeit: 99,999 bis 99,9999 Prozent beziehungsweise maximal fünf Minuten ungeplante Downtime pro Jahr.

Durchschnittliche Ausfallzeiten in Abhängigkeit vom Verfügbarkeitsniveau (in Stunden).

Verfügbarkeit (Prozent)

Betriebszeiten 7 x 24 Stunden

Betriebszeiten 7 x 12 Stunden

Betriebszeiten 5 x 12 Stunden

Betriebsstunden pro Jahr

8760

4380

3132

99,00000

87,6000

43,8000

31,3200

99,50000

43,8000

21,9000

15,6600

99,90000

8,7600

4,3800

3,1320

99,95000

4,3800

2,1900

1,5660

99,99000

0,8760

0,4380

0,3132

99,99500

0,4380

0,2190

0,1566

99,99900

0,0876

0,0438

0,0313

99,99990

0,0088

0,0044

0,0031

99,99999

0,0009

0,0004

0,0003

Ausfallsichere Systeme im Kostenvergleich

Auf der Kostenseite sind neben der Beschaffung der Hardware natürlich eine Reihe weiterer Faktoren zu berücksichtigen, so insbesondere die Kosten von Betriebssystem, Datenbanken, Applikationen, Implementierung, Serviceverträgen, Schulungen sowie die Betriebskosten für Administration und so weiter. Entsprechend der technologischen Eigenarten der genannten Systeme schlagen diese Faktoren verschieden zu Buche.

So müssen Applikationen für Cluster-Systeme angepasst werden, damit sie deren Leistungsfähigkeit auch in vollem Umfang nutzen können. Demgegenüber sind Standby-Server mit normaler Software zufrieden. Fehlertolerante Systeme sind seit einiger Zeit auch für die Standard-Betriebssysteme Windows und Linux verfügbar, die entsprechenden Applikationen laufen ohne Änderungen. Insbesondere ist die Implementierung eines Cluster-Systems viel aufwendiger als die eines fehlertoleranten Servers. Dieser ist zwar intern redundant ausgelegt, was für den Anwender jedoch völlig transparent ist – ihm gegenüber präsentiert sich der fehlertolerante Server wie ein Stand-alone-Gerät.

Kostenaufschlüsselung ausfallsicherer Systeme (in Euro)

Komponentenkosten

Standby

Cluster

Fehlertoleranter Server

Hardware

8.000

11.000

33.000

Betriebssystem

5.000

6.000

3.000

Datenbank

10.000

20.000

7.500

Applikation

8.000

8.000

4.000

Implementierung

1.000

9.000

3.000

Test

1.000

10.000

3.000

Schulung

0,00

3.000

0,00

Systemkosten

33.000

67.000

53.500

Laufende Kosten

Support pro Jahr

1.500

5.000

0,00

Service pro Jahr

1.000

12.000

5.000

Laufende Kosten gesamt

2.500

17.000

5.000

Da ein solches System nicht nur virtuell, sondern auch physikalisch ein einziger Rechner ist, benötigt es anders als Standby- oder Cluster-Server auch nur jeweils eine Softwarelizenz, was beispielsweise bei Datenbanken einen wichtigen Kostenfaktor darstellt. Die auf den ersten Blick höheren Anschaffungskosten der fehlertoleranten Systeme gegenüber den Cluster-Servern gleichen sich so bei Einbeziehung sämtlicher Kostenfaktoren wieder aus. Dazu kommt, dass bei Cluster-Systemen Administration, Service und Support deutlich aufwendiger sind, so dass hier mit hohen laufenden Kosten zu rechnen ist.

Jährliche Gesamtkosten für ausfallsichere Systeme (in Euro)

Nutzungszeit

Standby

Cluster

Fehlertoleranter Server

1 Jahr

35.500

84.000

58.500

2 Jahre

19.000

50.500

31.750

5 Jahre

9.100

30.400

15.700


Ausfallkosten im Vergleich

Unterm Strich sind die gesamten Anschaffungs- und Betriebskosten für Standby-Systeme am günstigsten. Hier gibt es ja auch keine technisch abgesicherte Verfügbarkeit, durch das bloße Bereithalten eines zweiten Servers wird ein System nicht hochverfügbar. Fehlertolerante Server erweisen sich bei Berücksichtigung aller Kostenfaktoren erstaunlicherweise schon in der Anschaffung als teurer. Klammert man die besonders kostentreibende Datenbank aus, so liegen diese beiden Alternativen gleichauf, durch die günstigeren laufenden Kosten haben die fehlertoleranten Server, sobald es in den Betrieb geht, die Nase wieder vorn.

Fehlertolerante Systeme im Vergleich (Euro pro Jahr, Nutzungszeit fünf Jahre)

Standby

Cluster

Fehlertoleranter Server

Verfügbarkeit (Prozent)

99,9

99,95

99,999

Systemkosten (zirka Angaben in Euro)

9.100

30.400

15.700

Downtime-Kosten (zirka Angaben in Euro)

180.000

90.000

2.000

Ob eine solche Investition und Kosten unterm Strich sinnvoll sind, zeigt der Vergleich mit den Kosten eines möglichen Systemausfalls. Pauschalisierte Downtime-Kosten, die für einen direkten Vergleich nötig wären, lassen sich allerdings nur schwer schätzen, weil sie, wie erwähnt, sehr stark von der Branche und vom jeweiligen Unternehmen abhängen. Verwendet man als Hilfsgröße die Kosten einer Industriestunde pro Mitarbeiter (43,50 Euro) und multipliziert diesen Wert mit der Ausfallwahrscheinlichkeit, so ergeben sich für die drei alternativen Lösungen bei 500 Mitarbeitern und einem 7x24-Stunden-Betrieb folgende hypothetische Szenarien:

Ausfallkosten abhängig von Betriebszeiten und Verfügbarkeitsniveau (in Euro, 500 Mitarbeiter, Kosten 42,50 je Stunde)

Verfügbarkeit (Prozent)

Betriebszeiten 7 x 24 Stunden

Betriebszeiten 7 x 12 Stunden

Betriebszeiten 5 x 12 Stunden

99,00000

1.861.500

930.750

443.700

99,50000

930.750

465.375

221.850

99,90000

186.150

93.075

44.370

99,95000

93.075

46.538

22.185

99,99000

18.615

9.308

4.437

99,99500

9.308

4.654

2.219

99,99900

1.862

931

444

99,99990

186,15

93,08

44,37

99,99999

18,62

9,31

4,44


Fazit und Ausblick