What is RTO and RPO in disaster recovery?
ディザスタリカバリでは、これらの数字が、組織のダウンタイムの長さや、失われる可能性のあるデータの量を決定します。 この重要な文脈において、「良い」復旧ポイント目標や復旧時間目標とは何でしょうか? その答えは一筋縄ではいきません。 標準的な良いRPO/RTOは、災害の種類や最大許容期間によって異なります。
まず、組織を保護したい災害の可能性を定義することが重要です。 データの回復とバックアップが必要な災害には次のようなものがあります。
- データの喪失。 これは、誰かがフォルダを削除したような単純なものから、ランサムウェアや感染したデータベースのような複雑なものまであります。
- アプリケーションの喪失。 これは、セキュリティの変更、アップデート、またはシステム構成がサービスに悪影響を与える場合を指します。
- システムの損失。 これは、ハードウェアが故障した場合や、仮想サーバーを使用している場合は、オペレーティングシステムがクラッシュした場合などを指します。
- ビジネスの場所の損失。 この例では、電気の停止、火災、洪水、あるいは建物の外に化学物質が流出するなどの災害が考えられます。 事業施設は別の場所に復旧する必要があります。
- オペレーションの喪失。 これは、事業活動が完全に停止してしまうことで、最悪のシナリオです。
これらの潜在的なシナリオは、災害復旧戦略においてデータ、システム、アプリケーション、物理的な場所を考慮することがいかに重要であるかを示しています。 これらの要素は、RTOとRPOの値に役割を果たします。 保護したい特定の災害シナリオを定義したら、顧客が最も防ぎたいと考えているシナリオに優先順位をつけ、顧客のRTOおよびRPO要件に合ったデータ保護機能を実装することができます。
RTO/RPO戦略には、3つ目の数値として、最大許容中断期間(MTPD)があります。 これは、顧客がシステム停止の危機管理を行える期間を表しており、管理するアプリケーションやサービスごとに異なります。 この数値には、従業員の賃金、売上の減少、株価の下落、復旧費用などの有形のコストと、風評リスクなどの無形のコストが含まれます。 MTPDを顧客と議論し、その数字をRTO/RPO削減戦略に適用することが重要です。
例えば、あるアプリケーションにおいて、顧客の最大許容時間は2時間であるとします。 つまり、理想的なRPOを達成するためには、目標とするリカバリータイムは2時間未満でなければならず、データのバックアップも2時間ごとに行わなければなりません。 これは、災害時に顧客のニーズを満たす物理的および仮想的なシステムを作るために必要なガイドラインとなります。
もし顧客が自分の最大許容破壊期間が分からない場合、より良い期待値を設定するのに役立ついくつかの重要な質問があります。
- この種のデータはどのくらいの頻度で変更されますか?
- このサービスのダウンタイムが1分ごとに発生すると、収益の損失や生産性の低下など、どのくらいのコストがかかりますか?
- このサービスが停止している間、必要に応じて鉛筆と紙でビジネスを処理できますか?
- ダウンタイムが発生した場合、顧客にどのような影響を与えるか
これらの質問を顧客と一緒に行うことで、災害シナリオでのリスクを最小限に抑えるために、何をどのようにバックアップする必要があるのかを逆算することができます。
SQL Server の RTO および RPO とは何ですか?
SQL Server は、Microsoft 専用のリレーショナル データベース管理システムで、他のアプリケーションからの要求に応じてデータの保存と取得を行います。 このサーバーでは、ユーザーが自動化されたログのバックアップを設定して、スタンバイ サーバーから復元することができます。 このログシッピングにより、ユーザーはかなり最近のデータベースコピーを復元することができます(そのプロセスのRTOとRPOに依存します)。
しかし、SQL Server の RTO および RPO は必ずしも単純ではありません。 多くの場合、クライアントが想像しているほど、プロセスは速くありません。 理想的なRPOを念頭に置いていても、ネットワークの速度が遅かったり、バックアップが正しく設定されていなかったりすると、このプロセスがスローダウンしてしまいます。 さらに、この方法でログ バックアップを復元すると、大量のデータを転送することになり、このプロセスは決定された許容範囲の RTO を簡単に超えてしまいます。