Sicherheit gibt es auch in der IT nicht zum Nulltarif. Wer für seine Geschäftsprozesse mehr Verfügbarkeit benötigt, als sie die handelsüblichen Systeme bieten, muss mit höheren Kosten sowohl in der Anschaffung als auch im Unterhalt rechnen. Allerdings kann der Verzicht auf zusätzliche Sicherheit ganz schön teuer werden - wobei den wenigsten Unternehmen bewusst ist, wie viel sie ein auch nur kurzzeitiger Ausfall ihrer Server-Systeme kosten kann.
Oft besteht schon über die wahrscheinlichen Ausfallzeiten der eingesetzten Systeme nur wenig Klarheit. "Normale" Server, also Systeme, die nicht speziell für hohe Zuverlässigkeit getunt sind, erreichen heute eine Verfügbarkeit von rund 99,5 Prozent. Das ist zwar erheblich mehr, als solche Geräte früher erreicht haben, bedeutet aber immer noch eine mittlere jährliche Ausfallzeit (Downtime) von über 40 Stunden. Cluster-Systeme erreichen heute Verfügbarkeitswerte zwischen 99,95 und 99,99 Prozent und fallen damit auch noch bis zu einer Stunde pro Jahr aus.
Systemausfälle und ihre Folgen
Die Kosten von einer Stunde Server-Stillstand hängen stark von der jeweiligen Branche und der Art des jeweiligen Geschäftsmodells ab. Auch in Zeiten vollständiger IT-Durchdringung gibt es natürlich immer noch Tätigkeiten, denen man sich zuwenden kann, solange die IT nicht verfügbar ist: Man kann zum Beispiel ein Meeting einberufen, telefonieren, einen Kunden besuchen, eine Kaffeepause halten und die liegengebliebenen Arbeiten später nachholen.
Ganz anders verhält es sich, wenn die IT die Prozesse nicht unterstützt, sondern sie unmittelbar steuert. Dann steht während einer Downtime beispielsweise die Produktion oder Auslieferung, Artikel kommen nicht aus dem Lager, Kunden können nicht bestellen oder - noch schlimmer - nicht bezahlen. Die Kosten für ausgefallene Arbeitszeit, als Ergebnis von Stundensatz und Zahl der betroffenen Mitarbeiter, können immer nur einen sehr groben Anhaltspunkt liefern, denn meist sind andere Faktoren gravierender: Womöglich sind auch Vertragsstrafen für nicht rechtzeitig erfolgte Lieferungen zu bezahlen, in der Automobilproduktion heute eine gängige Praxis.
Zu den unmittelbaren Ausfallkosten kommen außerdem die schwer zu quantifizierenden Schäden durch Imageverlust wie verärgerte Kunden und Lieferanten.
Je mehr die Geschäftsprozesse von der IT abhängen, desto seltener werden Fälle, in denen der Stillstand des IT-Systems nur geringfügige Folgen hat. Konnte man zum Beispiel vor zehn Jahren in solchen Fällen wenigstens noch telefonieren, so sind heute auch die Vermittlungsstellen in die IT integriert, zugleich hat sich ein Teil der Kommunikation mit E-Mail direkt auf die IT verlagert.
Branche |
Kosten pro Stunde (US-Dollar) |
Fertigung |
28.000 |
Logistik |
90.000 |
Einzelhandel |
90.000 |
Home-Shopping |
113.000 |
Medien (Pay per View) |
1.100.000 |
Bankrechenzentrum |
2.500.000 |
Kreditkartenverarbeitung |
2.600.000 |
Broker |
6.500.000 |
In Branchen, in denen das ganze Geschäftsmodell von der IT abhängt, können die Downtime-Kosten enorm hoch werden. So schätzt Contingency Research beispielsweise die Ausfallkosten für das Online-Shopping auf über 100.000 Dollar, für ein Bankrechenzentrum auf 2,5 Millionen Dollar und für das Online-Broking gar auf 6,5 Millionen Dollar – pro Stunde Downtime! Auch wenn die Systeme schnell wieder anlaufen, wäre der Schaden gewaltig, denn schon zehn Minuten Stillstand würden den Online-Broker mehr als eine Million kosten.
Wie hoch die Downtime-Kosten tatsächlich sind, hängt natürlich stark davon ab, wie im Einzelfall die Geschäftsprozesse organisiert sind. Umso bemerkenswerter ist, dass viele Unternehmen die Kosten, die ihnen dabei entstehen, selbst gar nicht kennen. Dies gaben jedenfalls in einer amerikanischen Untersuchung 39 Prozent der befragten IT-Verantwortlichen zu. Wer sich darüber schon Gedanken gemacht hatte, kam teilweise auf recht hohe Werte: Rund ein Drittel rechnete mit Kosten von mehr als 10.000 Dollar, 20 Prozent von ihnen sogar mit über 100.000 Dollar pro Stunde Downtime.
Nicht weniger bemerkenswert ist jedoch, dass hierzulande nicht einmal eine entsprechende Untersuchung vorgenommen wurde. Viele Unternehmen wollen sich von den Folgen eines Systemausfalls offenbar überraschen lassen - ein Standpunkt, der unter den Vorzeichen der derzeit so intensiv geführten Compliance-Diskussion kaum zukunftsfähig ist.
Systemausfall – das unterschätzte Risiko
Nicht überall ist das Risiko eines Systemausfalls eine betriebswirtschaftlich kalkulierbare Angelegenheit. Wo es um Menschenleben geht, etwa in der Flugsicherung, bei Rettungsleitstellen oder im Gesundheitswesen, muss für die Verfügbarkeit das technisch Mögliche um jeden Preis getan werden; dies gilt auch für die Bereiche, wo staatliche Auflagen hochverfügbare Systeme vorschreiben.
Im kommerziellen Einsatz müssen die möglichen Downtime-Kosten den Kosten für hochverfügbare IT-Systeme gegenübergestellt werden. Hochverfügbarkeit war in der Vergangenheit nur durch teure Spezialsysteme, wie zum Beispiel Tandem Himalaya, oder durch proprietäre Lösungen realisierbar. Diese erforderten Investitionen im Millionenbereich und waren im Unterhalt entsprechend teuer. Ihr Einsatz blieb denn auch speziellen Aufgaben vorbehalten und war für kommerzielle Anforderungen meist nicht wirtschaftlich.
Verfügbarkeit auf unterschiedlichem Niveau
Seit Ende der 90er Jahre sind aber auch verstärkt preiswertere Lösungen verfügbar. Sie verwenden verschiedene Technologien, bieten dementsprechend Verfügbarkeit auf unterschiedlichem Niveau und differieren natürlich auch hinsichtlich der Kosten.
Standby-Systeme: Redundante Systeme übernehmen bei Ausfällen wechselseitig die Prozesse. Durch Umschalten und Übergabe der Prozesse sind Ausfallzeiten unvermeidlich, die Konsistenz von Daten und Transaktionen muss separat sichergestellt werden. Erreichbare Verfügbarkeit: 99,5 bis 99,9 Prozent. Das entspricht einer ungeplanten Downtime von bis zu 8,7 Stunden pro Jahr.
Cluster-Systeme: Wichtige Komponenten der Systeme sind redundant ausgelegt. Bei Störungen sorgen spezielle Algorithmen Software-gesteuert für ein Umschalten, dadurch kommt es zu kurzen Ausfallzeiten beziehungsweise zum Verlust offener Transaktionen. Erreichbare Verfügbarkeit: 99,95 bis 99,99 Prozent. Das entspricht bis zu vier Stunden ungeplanter Downtime pro Jahr.
Fehlertolerante Systeme: Sämtliche Komponenten sind redundant ausgelegt, und alle Prozesse laufen parallel, so dass im Störungsfall keine Zeit durch den Wechsel auf funktionierende Komponenten verloren geht. Erreichbare Verfügbarkeit: 99,999 bis 99,9999 Prozent beziehungsweise maximal fünf Minuten ungeplante Downtime pro Jahr.
Verfügbarkeit (Prozent) |
Betriebszeiten 7 x 24 Stunden |
Betriebszeiten 7 x 12 Stunden |
Betriebszeiten 5 x 12 Stunden |
Betriebsstunden pro Jahr |
8760 |
4380 |
3132 |
99,00000 |
87,6000 |
43,8000 |
31,3200 |
99,50000 |
43,8000 |
21,9000 |
15,6600 |
99,90000 |
8,7600 |
4,3800 |
3,1320 |
99,95000 |
4,3800 |
2,1900 |
1,5660 |
99,99000 |
0,8760 |
0,4380 |
0,3132 |
99,99500 |
0,4380 |
0,2190 |
0,1566 |
99,99900 |
0,0876 |
0,0438 |
0,0313 |
99,99990 |
0,0088 |
0,0044 |
0,0031 |
99,99999 |
0,0009 |
0,0004 |
0,0003 |
Ausfallsichere Systeme im Kostenvergleich
Auf der Kostenseite sind neben der Beschaffung der Hardware natürlich eine Reihe weiterer Faktoren zu berücksichtigen, so insbesondere die Kosten von Betriebssystem, Datenbanken, Applikationen, Implementierung, Serviceverträgen, Schulungen sowie die Betriebskosten für Administration und so weiter. Entsprechend der technologischen Eigenarten der genannten Systeme schlagen diese Faktoren verschieden zu Buche.
So müssen Applikationen für Cluster-Systeme angepasst werden, damit sie deren Leistungsfähigkeit auch in vollem Umfang nutzen können. Demgegenüber sind Standby-Server mit normaler Software zufrieden. Fehlertolerante Systeme sind seit einiger Zeit auch für die Standard-Betriebssysteme Windows und Linux verfügbar, die entsprechenden Applikationen laufen ohne Änderungen. Insbesondere ist die Implementierung eines Cluster-Systems viel aufwendiger als die eines fehlertoleranten Servers. Dieser ist zwar intern redundant ausgelegt, was für den Anwender jedoch völlig transparent ist – ihm gegenüber präsentiert sich der fehlertolerante Server wie ein Stand-alone-Gerät.
Komponentenkosten |
Standby |
Cluster |
Fehlertoleranter Server |
Hardware |
8.000 |
11.000 |
33.000 |
Betriebssystem |
5.000 |
6.000 |
3.000 |
Datenbank |
10.000 |
20.000 |
7.500 |
Applikation |
8.000 |
8.000 |
4.000 |
Implementierung |
1.000 |
9.000 |
3.000 |
Test |
1.000 |
10.000 |
3.000 |
Schulung |
0,00 |
3.000 |
0,00 |
Systemkosten |
33.000 |
67.000 |
53.500 |
Laufende Kosten |
|||
Support pro Jahr |
1.500 |
5.000 |
0,00 |
Service pro Jahr |
1.000 |
12.000 |
5.000 |
Laufende Kosten gesamt |
2.500 |
17.000 |
5.000 |
Da ein solches System nicht nur virtuell, sondern auch physikalisch ein einziger Rechner ist, benötigt es anders als Standby- oder Cluster-Server auch nur jeweils eine Softwarelizenz, was beispielsweise bei Datenbanken einen wichtigen Kostenfaktor darstellt. Die auf den ersten Blick höheren Anschaffungskosten der fehlertoleranten Systeme gegenüber den Cluster-Servern gleichen sich so bei Einbeziehung sämtlicher Kostenfaktoren wieder aus. Dazu kommt, dass bei Cluster-Systemen Administration, Service und Support deutlich aufwendiger sind, so dass hier mit hohen laufenden Kosten zu rechnen ist.
Nutzungszeit |
Standby |
Cluster |
Fehlertoleranter Server |
1 Jahr |
35.500 |
84.000 |
58.500 |
2 Jahre |
19.000 |
50.500 |
31.750 |
5 Jahre |
9.100 |
30.400 |
15.700 |
Ausfallkosten im Vergleich
Unterm Strich sind die gesamten Anschaffungs- und Betriebskosten für Standby-Systeme am günstigsten. Hier gibt es ja auch keine technisch abgesicherte Verfügbarkeit, durch das bloße Bereithalten eines zweiten Servers wird ein System nicht hochverfügbar. Fehlertolerante Server erweisen sich bei Berücksichtigung aller Kostenfaktoren erstaunlicherweise schon in der Anschaffung als teurer. Klammert man die besonders kostentreibende Datenbank aus, so liegen diese beiden Alternativen gleichauf, durch die günstigeren laufenden Kosten haben die fehlertoleranten Server, sobald es in den Betrieb geht, die Nase wieder vorn.
Standby |
Cluster |
Fehlertoleranter Server | |
Verfügbarkeit (Prozent) |
99,9 |
99,95 |
99,999 |
Systemkosten (zirka Angaben in Euro) |
9.100 |
30.400 |
15.700 |
Downtime-Kosten (zirka Angaben in Euro) |
180.000 |
90.000 |
2.000 |
Ob eine solche Investition und Kosten unterm Strich sinnvoll sind, zeigt der Vergleich mit den Kosten eines möglichen Systemausfalls. Pauschalisierte Downtime-Kosten, die für einen direkten Vergleich nötig wären, lassen sich allerdings nur schwer schätzen, weil sie, wie erwähnt, sehr stark von der Branche und vom jeweiligen Unternehmen abhängen. Verwendet man als Hilfsgröße die Kosten einer Industriestunde pro Mitarbeiter (43,50 Euro) und multipliziert diesen Wert mit der Ausfallwahrscheinlichkeit, so ergeben sich für die drei alternativen Lösungen bei 500 Mitarbeitern und einem 7x24-Stunden-Betrieb folgende hypothetische Szenarien:
Verfügbarkeit (Prozent) |
Betriebszeiten 7 x 24 Stunden |
Betriebszeiten 7 x 12 Stunden |
Betriebszeiten 5 x 12 Stunden |
99,00000 |
1.861.500 |
930.750 |
443.700 |
99,50000 |
930.750 |
465.375 |
221.850 |
99,90000 |
186.150 |
93.075 |
44.370 |
99,95000 |
93.075 |
46.538 |
22.185 |
99,99000 |
18.615 |
9.308 |
4.437 |
99,99500 |
9.308 |
4.654 |
2.219 |
99,99900 |
1.862 |
931 |
444 |
99,99990 |
186,15 |
93,08 |
44,37 |
99,99999 |
18,62 |
9,31 |
4,44 |
Fazit und Ausblick