Firmenbrief

16.05.2006

Verfügbarkeit von Rechnersystemen


Verfügbarkeit von Rechnersystemen

Sprechen wir mit Anwendern/Kunden über das Thema "Verfügbarkeit" oder gar "Hochverfügbarkeit" von Systemen, insbesondere von Servern, gibt es aus unserer Erfahrung drei Gruppen von Gesprächspartnern:

a) die "solide Mittelschicht", die das Thema sehr sachlich, emotionslos und mit Erfahrungswerten unterfüttert adressiert
b) die "100% Verfügbaren" und
c) die "Vogel-Strauss-Methodiker"

Insbesondere unsere Definition der Gruppen b) und c) ist sicherlich erklärungsbedürftig.

b) die "100% Verfügbaren" sind häufig jene, die sich zunächst 7x24 Stunden Support für ihre IT
anbieten lassen, weil "es keinen Ausfall geben darf". Wenn wir im Gesprächsverlauf feststellen, dass die Unternehmensmitarbeiter mit wenigen Ausnahmen spätestens um 19:00 Uhr das Büro verlassen, sind wir schnell bei "handelsüblichen" 5x12-Stunden-Kontingenten angelangt. Hierdurch kann das Budget natürlich erheblich niedriger angesetzt werden. Ähnlich ist es mit Ansprüchen auf Höchstverfügbarkeit: Auch hier hilft eine genaue Analyse der realen Gegebenheiten im Betrieb und den damit verbundenen Kosten, um sich der Gruppe a) anzuschließen.

c) die Vogel-Strauss-Methodiker haben häufig eine längere Phase ohne große Ausfälle hinter sich und
hatten Glück auf ihrer Seite, dass ihre Systeme nicht durch Viren oder kaputte Update-Prozeduren korrumpiert wurden. Kommen zudem sogenannte "gewachsene IT-Strukturen" hinzu, also ein eher unstrukturierter Server-Zoo, reicht meist das virtuelle Durchspielen von einem oder mehrerer Szenarien mit den Folgen, um dem Thema Verfügbarkeit die nötige Aufmerksamkeit zu verschaffen.

Was aber ist Verfügbarkeit, durch welche Maßnahmen wird sie beeinflusst und wie hoch muss sie tatsächlich sein? Ein System ist dann verfügbar, wenn es die vorgesehenen Aufgaben erfüllen kann. Die Verfügbarkeit wird als Verhältnis aus Downtime und Uptime eines Systems bemessen:

Verfügbarkeit = Uptime / (Downtime + Uptime)

Systeme werden in Verfügbarkeitsklassen eingeteilt, die wie wie folgt definiert sind:


Verfügbarkeits- Klasse
Bezeichnung
in %
Ausfall/Jahr
2
Stabil
99,0
3,7 Tage
3
Verfügbar
99,9
8,8 Stunden
4
Hochverfügbar
99,99
52,6 Minuten
5
Fehlerunempfindlich
99,999
5,3 Minuten
6
Fehlertolerant
99,9999
32 Sekunden
7
Fehlerresistent
99,99999
3 Sekunden

(Quelle: Wikipedia wikipedia.org/wiki/Hochverfügbarkeit)

Um eine hohe Verfügbarkeit zu erreichen, darf also das System nicht oder nur sehr kurz ausfallen. Damit ist auch schon klar, dass es viele Einflussfaktoren und Betrachtungsweisen gibt:
- aus Sicht des Supports sind dies die Vereinbarungen der Service Level Agreements
- aus Hardware-Sicht sind dies die Vereinbarungen mit dem Hardware-Lieferanten über Reparatur- bzw. Austauschzeiten
- organisatorische Regelungen und ähnliches
- die IT-Architektur/Infrastruktur

In der Folge werden wir uns ausschliesslich auf den letzten Punkt konzentrieren und die Frage klären, wie eine ausreichende Verfügbarkeit erreicht werden kann, mit akzeptablem Aufwand für Hardware und Betriebssystem.

Hier werden wir 3 Ansätze behandeln:
a) Wiederaufsetzen von System und Daten aus dem Backup
b) Failover: Übernahme von Systemfunktionen durch "Cold Standby Server" (Aktiv/Passiv Cluster)
c) Übernahme von Systemfunktionen durch andere aktive Knoten (Aktiv/Aktiv Cluster)

Die Vor- und Nachteile dieser Ansätze stellen wir Ihnen im nächsten Linux-Firmenbrief ausführlicher vor.

Informationen zu unseren Dienstleistungen finden Sie auch auf unserer Homepage unter http://www.linux-ag.com