Eine Notfallwiederherstellungsstrategie konzentriert sich darauf, kritische Systeme und Infrastrukturen nach einer Störung wiederherzustellen. In diesem Artikel werden wir untersuchen, wie die Bereitschaft spezifischer Systeme oder Vermögenswerte für die Notfallwiederherstellung gemessen werden kann und wie die allgemeine Bereitschaft zur Notfallwiederherstellung durch die Aggregation von Daten aus einzelnen Vermögenswerten berechnet werden kann.

Über IT-Disaster-Recovery Hinaus
Mit durchschnittlich 4,2 datenbezogenen Unterbrechungen pro Jahr1 sehen wir einen wachsenden Trend, die IT-Disaster-Recovery zu skalieren und sie mit der allgemeinen GRC-Funktion in Einklang zu bringen.
Gleichzeitig führt eine zunehmende Zahl von Störereignissen, insbesondere extreme Wetterbedingungen, dazu, dass Organisationen über die grundlegende Geschäftskontinuität hinausblicken und einen breiteren Rahmen2 der Disaster-Recovery in Betracht ziehen, einschließlich Infrastrukturwiederherstellung, Einrichtungswiederherstellung, Betriebswiederherstellung und mehr.
Der Strategieimplementierungsansatz, basierend auf einer abgestimmten Strategie und funktionalen Scorecards, ermöglicht es Organisationen, die Prinzipien einer IT-Disaster-Recovery-Scorecard an diesen breiteren Rahmen anzupassen und in die Gesamtstrategie des Unternehmens zu integrieren.
Schritt 1. Geschäftsfolgen- und Risikoanalyse
Beginnen Sie mit der Gestaltung eines Notfallwiederherstellungs-Scorecards durch bestimmte Analysen und Planungsschritte3:
- Geschäftsfolgenanalyse, um kritische Vermögenswerte zu identifizieren
- Risikoanalyse, um potenzielle Auswirkungen von Unsicherheiten auf das Geschäft zu identifizieren
- Szenarioplanung, um zu untersuchen, wie identifizierte Risiken kritische Vermögenswerte beeinflussen könnten
Abhängig von der Komplexität der beteiligten Systeme und Stakeholder kann der Analyseprozess durch die Verwendung von funktionalen Scorecards formalisiert werden. Zum Beispiel:
- Geschäftskontinuitäts-Scorecard mit Vermögenszuordnung und Ereignisverfolgung.
- Zentrales Risikoregister mit Risikoidentifizierung und -analyse.
- Szenario-Scorecard zur Analyse von Frühindikatoren und zur Planung von Reaktionsstrategien.
Schritt 2. Wiederherstellungspunkt- und Wiederherstellungszeitziele Festlegen
In diesem Schritt legen wir fest:
- Wiederherstellungspunktziel (akzeptabler Verlust, wie z. B. akzeptabler Datenverlust) und
- Wiederherstellungszeitziel (akzeptable Betriebsunterbrechung).
Für die Scorecard-Berechnungen werden wir zunächst Metriken für ein spezifisches System oder Asset definieren und sie dann zu einem Gesamt-Compliance-Score kombinieren.
Katastrophenwiederherstellungs-KPIs für ein Spezifisches System
Beim Fokus auf Katastrophenwiederherstellung in der IT können Organisationen Metriken wie Zuverlässigkeit, Wiederherstellungszeit und Wiederherstellungspunkt verfolgen, um ihre Strategien zu bewerten und zu verbessern.
Zuverlässigkeitsmetriken
- Mittlere Zeit zwischen Ausfällen (MTBF): Zeit zwischen reparierbaren Systemausfällen.
- Mittlere Zeit bis zum Ausfall (MTTF): Zeit zwischen nicht reparierbaren Systemausfällen, wie die gesamte Lebensdauer eines Systems.
Wiederherstellungszeit-Metriken
- Mittlere Wiederherstellungszeit (MTTR)
- Wiederherstellungszeit-Ziel (RTO): Maximale zulässige Ausfallzeit nach einer Unterbrechung oder das Ziel-MTTR.

Wiederherstellungspunkt-Metriken
- Tatsächliche Backup-Frequenz
- Wiederherstellungszielpunkt (RPO): Maximale akzeptable Datenverlustzeit oder das Ziel für die Backup-Frequenz.
Berechnung der Leistung: Linear vs. Binär
Es gibt zwei gängige Ansätze zur Berechnung der Leistung von Kennzahlen zur Katastrophenwiederherstellung:
- Lineare Optimierungsfunktion
- Binäre Optimierungsfunktion
Zum Beispiel sind Zuverlässigkeitskennzahlen in unserer Vorlage als lineare Optimierungsfunktionen konfiguriert. Dies bedeutet, dass sich die Leistung allmählich verbessert, wenn der Wert der Kennzahl vom Basiswert in Richtung des Ziels steigt.
Beispiel
Das MTBF für ein Customer Relationship Management (CRM)-System hat ein Ziel von 10.000 Stunden, mit einem tatsächlichen Wert von 8.000 Stunden.

- Mithilfe einer linearen Funktion wird die Leistung als 80 % berechnet (= 8.000 / 10.000).
- Mithilfe einer binären Funktion beträgt die Leistung 0 %, da das Ziel von 10.000 Stunden nicht erreicht wurde.

Binäre Leistungsfunktionen werden häufig für MTTR verwendet:
- Wenn MTTR kleiner oder gleich dem RTO ist, beträgt die Leistung 100 %.
- Wenn MTTR den RTO überschreitet, beträgt die Leistung 0 %.
Wiederherstellungszeit-Ziel als Separater Indikator
MTTR hat einen aktuellen Wert und einen Zielwert. Der Zielwert entspricht dem aktuellen „Wiederherstellungszeit-Ziel (RTO)“-Indikator.
Obwohl es möglich ist, den RTO-Indikator zu entfernen und das Ziel direkt für MTTR festzulegen, erfordern Compliance- und Berichterstattungsanforderungen oft, dass sie separat verfolgt werden. Daher wird der RTO als eigenständiger Indikator beibehalten.
Risikodefinitionen
Die Formulierung einer Katastrophenwiederherstellungsstrategie beginnt mit einer Geschäftsfolgenabschätzung und Risikoanalyse. Einige Risiken werden in einem zentralen Risikoregister erfasst, während spezifischere Risiken mit dem Katastrophenwiederherstellungs-Scorecard für einzelne Vermögenswerte verknüpft werden können.

Der Schlüssel liegt darin, eine klare Verbindung zwischen den Ergebnissen der Folgenabschätzung oder Risikoanalyse und den Wiederherstellungsmetriken für spezifische Geschäftssysteme sicherzustellen. Zum Beispiel wurden für die Vermögenswerte der Webserver die Risiken von „Ausgenutzten Schwachstellen“ und „DDoS-Angriffen“ lokal definiert.
Kontinuierliche Überwachung der Notfallwiederherstellungsstrategie
Metriken zur Notfallwiederherstellung entwickeln sich im Laufe der Zeit:
- Ziele können basierend auf aktualisierten Risikomodellen angepasst werden.
- Ist-Werte werden mit historischen Leistungsdaten aktualisiert.
Wichtige Überlegungen umfassen:
- Die Häufigkeit der Aktualisierung oder Überarbeitung der Metriken.
- Umgang mit Zeiträumen ohne Daten, z. B. ob Daten geerbt oder nur explizit eingegebene Daten angezeigt werden sollen.
Implementierung Über Synchronisierung Von Vorlage
Um die Implementierung von Disaster-Recovery-Kennzahlen und -Kontrollen zu erleichtern, sollten Sie die Funktion „Synchronisierung von Vorlage“ in Betracht ziehen:
- Erstellen eines Vorlagensatzes von Kennzahlen zur Bewertung eines Vermögenswerts.
- Erstellen von Replikaten, die von der Vorlage synchronisiert werden.
Erfahren Sie mehr über die Synchronisierungsfunktion.
Berechnung der Gesamtkonformität
Um die Gesamtbereitschaft zu bewerten, kombinieren wir die Leistung der einzelnen Assets. Bei Bedarf können Gewichte angewendet werden, um die relative Bedeutung jedes Assets widerzuspiegeln.
Alternativ kann die Gesamtkonformität unter Verwendung des kritischen Pfadansatzes berechnet werden, wobei der Fokus auf der Leistung kritischer Systeme liegt.
Zum Beispiel in unserer Vorlage:
- RPO-Konformität (Kritischer Pfad) umfasst Assets mit Wiederherstellungspunktzielen (RPOs) von 24 und 12 Stunden. Der gesamte RPO ist der Mindestwert dieser Werte, d.h. 12 Stunden.
- Wenn auch nur ein Asset sein RPO nicht erfüllt (z.B. „RPO für Bestandsverwaltung“), wird der gesamte RPO nicht erreicht.
Die Gesamtscorecards für Wiederherstellungszeit- und Wiederherstellungspunktmetriken können als Datenquelle für die Konformitäts-Scorecard und andere GRC-bezogene funktionale Scorecards verwendet werden.
Dashboard zur Katastrophenwiederherstellungsbereitschaft
Wichtige Kennzahlen aus dem Katastrophenwiederherstellungs-Scorecard können auf einem Dashboard neben Risikodiagrammen und Verbesserungsinitiativen visualisiert werden.

Eine Strategiekarte bietet einen klaren Überblick über spezifische Systeme und deren aggregierte Leistung und bietet einen umfassenden Überblick.

Schritt 3. Einrichtung Interner Kontrollen für die Notfallwiederherstellung
Die Definition von Kennzahlen zur Notfallwiederherstellung (Schritt 2) ermöglicht es der Organisation, akzeptable Verlust- und Wiederherstellungsniveaus festzulegen sowie ihre Bereitschaft für disruptive Ereignisse zu quantifizieren. Diese Kennzahlen enthalten jedoch keine spezifischen Notfallpläne, Verantwortungszuweisungen4 oder Validierungs- und Testverfahren. Um dies zu adressieren, müssen geeignete interne Kontrollen entworfen werden.
In früheren Artikeln haben wir den allgemeinen Ansatz zur Einrichtung interner Kontrollen sowie deren praktische Anwendung im Geschäftskontinuitätsmanagement diskutiert.
Im Kontext der Notfallwiederherstellung besteht der Großteil der
Stakeholder und Eigentümer
Die Einbeziehung wichtiger Stakeholder ist entscheidend für den Erfolg einer Katastrophenschutzstrategie 5. Auf praktischer Ebene kann die Rechenschaftspflicht durch die Zuweisung von Eigentümern für Katastrophenschutzmetriken und -initiativen verbessert werden.
Schlussfolgerungen
Das IT-Katastrophenwiederherstellungs-Scorecard kombiniert verschiedene Ansätze zur Leistungsbewertung.
Beim Quantifizieren spezifischer Vermögenswerte oder Systeme verlassen wir uns auf:
- Mittlere Zeit zwischen Ausfällen (MTBF) und Mittlere Zeit bis zum Ausfall (MTTF) zur Schätzung der Zuverlässigkeit.
- Wiederherstellungszeit-Ziel (RTO), das das Ziel für die Mittlere Wiederherstellungszeit (MTTR) festlegt.
- Wiederherstellungspunkt-Ziel (RPO), das das Ziel für die Backup-Häufigkeit festlegt.
Die Leistung dieser Metriken wird typischerweise als binäre Funktion berechnet, bei der die Leistung 0 % beträgt, bis der tatsächliche Wert das Wiederherstellungsziel erreicht.
Die Wiederherstellungs-Metriken für einzelne Vermögenswerte oder Systeme können kombiniert werden (zum Beispiel unter Verwendung des kritischen Pfadansatzes), um den gesamten Bereitschafts- oder Konformitätswert zu berechnen.
Nutzen Sie Disaster Recovery Vorlage
BSC Designer hilft Organisationen bei der Implementierung ihrer komplexen Strategien:
- Melden Sie sich für einen kostenlosen Plan auf der Plattform an.
- Verwenden Sie die
Disaster Recovery Vorlage als Ausgangspunkt. Sie finden sie unter Neu > Neue Scorecard > Weitere Vorlagen.
- Folgen Sie unserem Strategie-Implementierungssystem, um Stakeholder und strategische Ambitionen in eine umfassende Strategie zu integrieren.
Fangen Sie noch heute an und sehen Sie, wie BSC Designer Ihre Strategieimplementierung vereinfachen kann!
- IDC, The State of Disaster Recovery and Cyber-Recovery, 2024–2025: Factoring in AI, 2024, IDC ↩
- Disaster Recovery Framework Guide, 2020, World Bank Group ↩
- Design Your Organization to Withstand Future Disasters, M. Reeves, K. Whitaker, Harvard Business Review, 2022. ↩
- Disaster Resilience Scorecard for Cities, UNDRR, 2024. ↩
- Katastrophenresilienz-Scorecard für Städte, UNDRR, 2024. ↩
Alexis Savkin ist Strategiearchitekt und Gründer von BSC Designer, einer Softwareplattform zur Strategieumsetzung, deren Kern die Balanced Scorecard bildet. Er unterstützt Organisationen dabei, Strategien in messbare Ziele, KPIs und Initiativen zu übersetzen. Alexis ist der Entwickler des Strategy Execution Canvas, Autor von über 100 Artikeln zu Strategie und Leistungsmessung sowie regelmäßiger Redner.