¿Qué es el RTO y el RPO en la recuperación de desastres?
En la recuperación de desastres, estos números determinan cuánto tiempo experimenta su organización el tiempo de inactividad, y cuántos datos podrían perderse. En este importante contexto, ¿qué es un «buen» objetivo de punto de recuperación o de tiempo de recuperación? La respuesta no es sencilla. Un buen RPO/RTO estándar depende del tipo de desastre, así como del periodo máximo tolerable de interrupción.
En primer lugar, es importante definir el conjunto potencial de desastres contra los que le gustaría proteger a su organización. Algunos desastres que requieren la recuperación de datos y la realización de copias de seguridad son:
- Pérdida de datos: Esto puede ser tan simple como que alguien borre una carpeta, o tan complejo como un caso de ransomware o una base de datos infectada.
- Pérdida de una aplicación: Se refiere a cuando los cambios en la seguridad, una actualización o las configuraciones del sistema afectan negativamente a los servicios.
- Pérdida de un sistema: Esto incluye cuando el hardware falla o, si se tiene un servidor virtual, cuando el sistema operativo se cae.
- Pérdida de la ubicación del negocio: En este caso, un desastre puede incluir un apagón eléctrico, un incendio, una inundación o incluso un derrame químico fuera del edificio. Las instalaciones de la empresa deben recuperarse en una ubicación alternativa.
- Pérdida de operaciones: Se trata de una paralización completa de las operaciones del negocio, es decir, el peor de los casos.
- ¿Con qué frecuencia cambia este tipo de datos?
- ¿Cuánto cuesta cada minuto de inactividad de este servicio, ya sea en pérdida de ingresos o de productividad?
- ¿Podría realizar transacciones comerciales con lápiz y papel, si fuera necesario, mientras este servicio está inactivo?
- Si está experimentando un tiempo de inactividad, ¿cómo repercute en sus clientes?
Cada uno de estos posibles escenarios ilustra lo importante que es tener en cuenta sus datos, sistemas, aplicaciones y ubicación física en su estrategia de recuperación de desastres. Estos factores desempeñan un papel en los valores de RTO y RPO. Una vez que haya definido los escenarios de desastre particulares contra los que espera protegerse, puede priorizar los escenarios que su cliente está más interesado en prevenir, y luego implementar características de protección de datos que coincidan con sus requisitos de RTO y RPO.
Una tercera cifra es un factor en su estrategia de RTO/RPO: el período máximo tolerable de interrupción (MTPD). Esto representa el tiempo que su cliente es capaz de gestionar la crisis de una interrupción del sistema, y varía para cada aplicación y servicio que gestiona. Entre los factores que influyen en esta cifra se encuentran los costes tangibles, como los salarios de los empleados, la pérdida de ventas, el debilitamiento de las cotizaciones bursátiles y los gastos de recuperación, así como los intangibles, como el riesgo para la reputación. Es importante discutir el MTPD con su cliente, y luego aplicar esa cifra a su estrategia de reducción de RTO/RPO.
Por ejemplo, para una aplicación determinada, el periodo máximo de tolerancia de su cliente podría ser de dos horas. Eso significa que su objetivo de tiempo de recuperación debe ser igual a menos de dos horas, y sus datos deben ser respaldados menos de cada dos horas para cumplir con el RPO ideal. Esto le da la pauta que necesita para crear un sistema físico y virtual que satisfaga las necesidades de su cliente en caso de desastre.
Si su cliente no está seguro de cuál es su período máximo tolerable de interrupción, hay algunas preguntas clave que pueden ayudarle a establecer mejores expectativas. Haga estas preguntas para entender el RTO y RPO de un cliente a un nivel más granular.
Revisar estas preguntas con su cliente puede ayudarle a trabajar de forma retrospectiva en lo que necesita hacer una copia de seguridad y en la forma en que estos datos deben ser respaldados para minimizar el riesgo en un escenario de desastre.
¿Qué es el RTO y el RPO en SQL Server?
SQL Server es un sistema de gestión de bases de datos relacionales específico de Microsoft que almacena y recupera datos según lo soliciten otras aplicaciones. El servidor permite a los usuarios configurar copias de seguridad de registros automatizadas que se restauran desde un servidor en espera. Con este envío de registros, los usuarios pueden recuperar una copia de la base de datos bastante reciente, dependiendo del RTO y RPO de ese proceso. Esos requisitos de RTO y RPO los establecen los usuarios, dependiendo de sus necesidades, presupuesto y cualquier limitación tecnológica de la red.
Sin embargo, los RTO y RPO de SQL Server no son necesariamente sencillos. En muchos casos, el proceso no es tan rápido como un cliente puede imaginar. Puede que tengan en mente un RPO ideal, pero las velocidades lentas de la red o una copia de seguridad mal configurada pueden estrangular este proceso. Además, restaurar una copia de seguridad de registros de esta manera puede implicar la transferencia de grandes cantidades de datos, y este proceso puede superar fácilmente el RTO aceptable determinado.