KontaktRufen Sie uns an +49 89 993412-0

Disaster Recovery – Wiederherstellung der IT nach kritischen Vorfällen

19. May 2021 RST

„Man kann es auch übertreiben!“ Diese Aussage hören wir manchmal, wenn wir mittelständische Unternehmen auf die Notwendigkeit von Disaster-Recovery-Plänen hinweisen. Das Konzept Datensicherung ist bekannt und akzeptiert, darüber hinausgehende Überlegungen und Vorkehrungen werden aber zum Teil mit der Bemerkung abgetan, dass in den letzten 20 Jahren ja auch nichts passiert wäre.

Diese Einstellung ändert sich spätestens dann, wenn die IT durch einen Fehler oder einen Virenbefall tagelang nicht verfügbar und der betriebswirtschaftliche Schaden groß ist. Da Unternehmen immer mehr auf eine hohe Verfügbarkeit der IT angewiesen sind, hat sich ihre Toleranz für Ausfallzeiten verringert. Vorausschauende Organisationen erstellen deshalb Disaster-Recovery-Pläne zur Vorbereitung. Diese beschreiben in strukturierter Form die Vorgehensweisen und Maßnahmen, die zur Wiederaufnahme der geschäftskritischen Funktionen erforderlich sind.

Ziel von Disaster Recovery (DR) ist es, die ökonomischen Auswirkungen auf das betroffene Unternehmen so gering wie möglich zu halten. Hierzu sollte nach Möglichkeit die Funktion der IT aufrecht erhalten werden (notfalls in reduziertem Umfang) oder die IT sollte nach einem Totalausfall möglichst rasch wieder mit alter Funktionalität starten.

Ursachen und Auslöser

Ausfälle der IT-Systeme können unterschiedlichste Ursachen haben, die meisten kann oder will man sich gar nicht vorstellen – sie passieren jedoch trotzdem. Während in anderen Teilen der Welt häufig Naturkatastrophen Auslöser von schweren Störungen sind, sind es in unseren Breiten eher Brände, Wasserrohrbrüche sowie Hardware- und Softwareprobleme, die große Folgewirkung auslösen. Das größte Bedrohungspotenzial stellen heute wohl Angriffe aus dem Internet mit Viren, Verschlüsselungstrojanern sowie Denial-of-Service-Attacken dar.

Auswirkung und Betroffene

Aufgrund der großen Auswirkung von IT-Störungen auf die Prozesse und den Betrieb von Unternehmen ist ein vorhandener DR-Plan Teil des QM-Systems. Er ist aber auch für andere Interessengruppen relevant. So wollen Lieferanten sicher sein, dass ihre Waren bezahlt werden können, Kunden wollen sicher sein, dass der Lieferant stabil bleibt, Wirtschaftsprüfer haben in der Kommentierung der Bilanz das Risiko hieraus zu bewerten und die Geschäftsleitung kann durch einen vorhandenen DR-Plan belegen, dass sie nicht fahrlässig handelt.

Erstellung eines DR-Plans

Der Aufwand für die Erstellung eines DR-Plans hängt natürlich von der Größe des Unternehmens ab und in welcher Tiefe der Plan erstellt wird. Hier zeigt sich der Gehalt eines Sprichworts ganz besonders: Jeder Plan ist besser als kein Plan. Allein die Beschäftigung mit der Thematik bringt Erkenntnisgewinne und spürbare Verbesserungen für die Wiederherstellbarkeit. Viele Ausfälle können mit einfachen und naheliegenden Mitteln verhindert werden, beispielsweise durch Clustering mit redundantem Storage, die Nutzung redundanter Netzteile oder getrennte Serverräume und konsequentes Backup außer Hause. Diese Ansätze können Ausgangspunkt für eine schrittweise Weiterentwicklung zu einem detaillierteren DR-Plan sein. Bei der Beschäftigung mit Disaster-Recovery stößt man sehr früh auf die beiden Begrifflichkeiten RTO und RPO, die als Grundlage für alle weiteren Überlegungen dienen. Sie zeigen, welche Folgen einer Störung für ein Unternehmen noch akzeptabel sind.

Recovery Time Objective (RTO)

„Wie lange darf ein Geschäftsprozess/System ausfallen? Bei der Recovery Time Objective handelt es sich um die Zeit, die vom Zeitpunkt des Schadens bis zur vollständigen Wiederherstellung der Geschäftsprozesse (Wiederherstellung von: Infrastruktur – Daten – Nacharbeitung von Daten – Wiederaufnahme der Aktivitäten) vergehen darf. Der Zeitraum kann hier von 0 Minuten (Systeme müssen sofort verfügbar sein), bis mehrere Tage (in Einzelfällen Wochen) betragen.“ (Quelle)

Recovery Point Objective (RPO)

„Wie viel Datenverlust kann in Kauf genommen werden? Bei der Recovery Point Objective handelt es sich um den Zeitraum, der zwischen zwei Datensicherungen liegen darf, das heißt, wie viele Daten/Transaktionen dürfen zwischen der letzten Sicherung und dem Systemausfall höchstens verloren gehen. Wenn kein Datenverlust hinnehmbar ist, beträgt die RPO 0 Sekunden.“ (Quelle)

Sobald ein Unternehmen die beiden Werte für sich bestimmt hat, werden alle weiteren Schlussfolgerungen auf diese Basis abgestellt. Im nächsten Teil dieses Artikels werden die Vorarbeiten für die Erstellung eines DR-Plans, beispielsweise die unternehmensspezifische Anforderungsanalyse beschrieben sowie die Struktur des DR-Plans, in dem sich die Inhalte widerspiegeln.