O que é RTO e RPO na recuperação de desastres?
Na recuperação de desastres, estes números determinam durante quanto tempo a sua organização experimenta períodos de inactividade, e quantos dados podem ser perdidos. Neste importante contexto, o que é um objectivo de “bom” ponto de recuperação ou objectivo de tempo de recuperação? A resposta não é simples. Um bom RPO/RTO padrão depende do tipo de desastre, bem como do período máximo tolerável de perturbação.
Primeiro, é importante definir o conjunto potencial de desastres contra os quais gostaria de proteger a sua organização. Algumas catástrofes que requerem recuperação e backup de dados incluem:
- Perda de dados: Isto pode ser tão simples como alguém apagar uma pasta, ou tão complexo como um caso de resgate ou uma base de dados infectada.
- Perda de uma aplicação: Isto refere-se a quando alterações à segurança, uma actualização, ou configurações de sistema têm um impacto negativo nos serviços.
- Perda de um sistema: Isto inclui quando o hardware falha, ou, se tiver um servidor virtual, quando o sistema operativo falhar.
- Perda da localização do negócio: Neste caso, um desastre pode incluir uma falha eléctrica, incêndio, inundação, ou mesmo um derrame químico no exterior do edifício. As instalações empresariais requerem recuperação para um local alternativo.
- Perda de operações: Esta é uma paragem completa das operações comerciais – ou seja, o pior cenário possível.
Cada um destes cenários potenciais ilustra como é importante considerar os seus dados, sistemas, aplicações e localização física na sua estratégia de recuperação de desastres. Estes factores desempenham um papel nos valores RTO e RPO. Uma vez definidos os cenários de desastre específicos contra os quais se espera proteger, pode dar prioridade aos cenários que o seu cliente está mais interessado em prevenir, depois implementar características de protecção de dados que correspondam aos seus requisitos de RTO e RPO.
Um terceiro factor de figura na sua estratégia de RTO/RPO: o período máximo tolerável de perturbação (MTPD). Isto representa quanto tempo o seu cliente é capaz de gerir uma interrupção do sistema em caso de crise, e varia para cada aplicação e serviço que gere. Os factores que influenciam este valor incluem custos tangíveis como salários dos funcionários, perda de vendas, preços de stocks enfraquecidos, e despesas de recuperação, bem como intangíveis como o risco de reputação. É importante discutir o MTPD com o seu cliente, e depois aplicar esse número à sua estratégia de redução do RTO/RPO.
Por exemplo, para uma determinada aplicação, o período máximo de tolerância do seu cliente pode ser de duas horas. Isso significa que o seu objectivo de tempo de recuperação deve ser inferior a duas horas, e os seus dados devem ser copiados a menos de duas em duas horas para cumprir a RPO ideal. Isto dá-lhe a orientação de que necessita para criar um sistema físico e virtual que satisfaça as necessidades do seu cliente em caso de catástrofe.
Se o seu cliente não tiver a certeza de qual é o seu período máximo tolerável de perturbação, há algumas questões-chave que podem ajudá-lo a estabelecer melhores expectativas. Faça estas perguntas para compreender o RTO e RPO de um cliente a um nível mais granular.
- Quantas vezes este tipo de dados muda?
- O que custa cada minuto de inactividade para este serviço, seja em receitas perdidas ou produtividade perdida?
- Pode fazer negócios com lápis e papel, se necessário, enquanto este serviço está em baixo?
- Se estiver a passar por um período de inactividade, como é que isso afecta os seus clientes?
Olhar estas questões com o seu cliente pode ajudá-lo a trabalhar para trás para o que precisa de fazer backup e como é que estes dados precisam de ser armazenados para minimizar o risco num cenário de desastre.
O que é RTO e RPO no SQL Server?
SQL Server é um sistema de gestão de bases de dados relacional específico da Microsoft que armazena e recupera dados tal como solicitado por outras aplicações. O servidor permite aos utilizadores configurarem backups de registo automatizados para serem restaurados a partir de um servidor standby. Com este envio de registo, os utilizadores podem recuperar uma cópia de base de dados bastante recente, dependendo do RTO e RPO desse processo. Esses requisitos de RTO e RPO são definidos pelos utilizadores, dependendo das suas necessidades, orçamento, e quaisquer limitações tecnológicas da rede.
No entanto, a RTO e RPO do servidor SQL não são necessariamente simples. Em muitos casos, o processo não é tão rápido como um cliente possa imaginar. Podem ter uma RPO ideal em mente, mas velocidades de rede lentas ou uma cópia de segurança configurada incorrectamente podem acelerar este processo. Além disso, a restauração de um backup de registo desta forma pode envolver a transferência de grandes quantidades de dados, e este processo pode facilmente exceder a RTO aceitável determinada.