Was bedeuten RTO und RPO bei der Disaster Recovery?
Bei der Disaster Recovery bestimmen diese Zahlen, wie lange Ihr Unternehmen Ausfallzeiten hat und wie viele Daten verloren gehen könnten. Was ist in diesem wichtigen Zusammenhang ein „gutes“ Wiederherstellungspunkt- oder Wiederherstellungszeit-Ziel? Die Antwort ist nicht ganz einfach. Ein gutes Standard-RPO/RTO hängt sowohl von der Art der Katastrophe als auch von der maximal tolerierbaren Dauer der Unterbrechung ab.
Zunächst ist es wichtig, die möglichen Katastrophen zu definieren, gegen die Sie Ihre Organisation schützen möchten. Einige Katastrophen, die eine Datenwiederherstellung und Datensicherung erfordern, sind:
- Verlust von Daten: Dies kann so einfach sein, wie das Löschen eines Ordners durch jemanden, oder so komplex wie ein Fall von Ransomware oder eine infizierte Datenbank.
- Verlust einer Anwendung: Dies bezieht sich darauf, wenn Änderungen an der Sicherheit, ein Update oder Systemkonfigurationen sich negativ auf Dienste auswirken.
- Verlust eines Systems: Dazu gehört, wenn die Hardware ausfällt, oder, wenn Sie einen virtuellen Server haben, wenn das Betriebssystem abstürzt.
- Verlust des Geschäftsstandorts: In diesem Fall kann eine Katastrophe einen Stromausfall, ein Feuer, eine Überschwemmung oder sogar einen Chemieunfall außerhalb des Gebäudes umfassen. Die Geschäftseinrichtungen müssen an einem alternativen Standort wiederhergestellt werden.
- Verlust des Betriebs: Dies ist ein kompletter Stillstand des Geschäftsbetriebs – also das Worst-Case-Szenario.
Jedes dieser möglichen Szenarien zeigt, wie wichtig es ist, Ihre Daten, Systeme, Anwendungen und den physischen Standort in Ihrer Disaster-Recovery-Strategie zu berücksichtigen. Diese Faktoren spielen eine Rolle bei den RTO- und RPO-Werten. Sobald Sie die speziellen Katastrophenszenarien definiert haben, vor denen Sie sich schützen wollen, können Sie die Szenarien priorisieren, an deren Vermeidung Ihr Kunde am meisten interessiert ist, und dann Datenschutzfunktionen implementieren, die seinen RTO- und RPO-Anforderungen entsprechen.
Eine dritte Zahl fließt in Ihre RTO/RPO-Strategie ein: die maximal tolerierbare Unterbrechungsdauer (MTPD). Sie gibt an, wie lange Ihr Kunde in der Lage ist, einen Systemausfall zu bewältigen, und variiert für jede Anwendung und jeden Dienst, den Sie verwalten. Zu den Faktoren, die in diese Zahl einfließen, gehören materielle Kosten wie Mitarbeiterlöhne, Umsatzeinbußen, geschwächte Aktienkurse und Wiederherstellungskosten, aber auch immaterielle Faktoren wie das Reputationsrisiko. Es ist wichtig, die MTPD mit Ihrem Kunden zu besprechen und diese Zahl dann auf Ihre RTO/RPO-Reduktionsstrategie anzuwenden.
Beispielsweise könnte die maximale Toleranzzeit Ihres Kunden für eine bestimmte Anwendung zwei Stunden betragen. Das bedeutet, dass Ihr Ziel für die Wiederherstellungszeit weniger als zwei Stunden betragen muss und Ihre Daten weniger als alle zwei Stunden gesichert werden müssen, um das ideale RPO zu erfüllen. Dies gibt Ihnen die Richtschnur, die Sie benötigen, um ein physisches und virtuelles System zu erstellen, das den Anforderungen Ihres Kunden im Katastrophenfall gerecht wird.
Wenn Ihr Kunde sich nicht sicher ist, was seine maximal tolerierbare Unterbrechungsdauer ist, gibt es ein paar Schlüsselfragen, die ihm helfen können, bessere Erwartungen zu stellen. Stellen Sie diese Fragen, um die RTO und RPO eines Kunden auf einer detaillierteren Ebene zu verstehen.
- Wie oft ändert sich diese Art von Daten?
- Was kostet jede Minute Ausfallzeit für diesen Dienst, entweder in Form von entgangenem Umsatz oder verlorener Produktivität?
- Könnten Sie Geschäfte mit Bleistift und Papier abwickeln, wenn nötig, während dieser Dienst ausfällt?
- Wenn Sie eine Ausfallzeit haben, wie wirkt sich das auf Ihre Kunden aus?
Wenn Sie diese Fragen mit Ihrem Kunden durchgehen, können Sie rückwärts arbeiten, um herauszufinden, welche Daten Sie sichern müssen und wie diese Daten gesichert werden müssen, um das Risiko in einem Katastrophenszenario zu minimieren.
Was sind RTO und RPO in SQL Server?
SQL Server ist ein Microsoft-spezifisches relationales Datenbankmanagementsystem, das Daten speichert und abruft, wie sie von anderen Anwendungen angefordert werden. Der Server ermöglicht es Benutzern, automatische Log-Backups einzurichten, die von einem Standby-Server wiederhergestellt werden. Mit diesem Protokollversand können Benutzer eine relativ aktuelle Datenbankkopie wiederherstellen – abhängig von den RTO- und RPO-Anforderungen dieses Prozesses. Diese RTO- und RPO-Anforderungen werden von den Anwendern festgelegt, abhängig von ihren Bedürfnissen, ihrem Budget und eventuellen technologischen Netzwerkeinschränkungen.
Allerdings sind SQL Server RTO und RPO nicht unbedingt einfach. In vielen Fällen ist der Prozess nicht so schnell, wie es sich ein Kunde vorstellt. Sie haben vielleicht einen idealen RPO im Kopf, aber langsame Netzwerkgeschwindigkeiten oder ein falsch konfiguriertes Backup können diesen Prozess drosseln. Außerdem können bei der Wiederherstellung eines Log-Backups auf diese Weise große Datenmengen übertragen werden, und dieser Prozess kann leicht die festgelegte akzeptable RTO überschreiten.