Quando ouvimos a palavra "desastre", é comum pensar em furacões, incêndios florestais e outros eventos raros e catastróficos. Mas, para os prestadores de serviços gerenciados (MSPs), "desastre" vai além do que aparece nas manchetes. Um único ataque de ransomware, uma semana sem provedor de internet ou até um erro humano que apaga dados críticos do cliente — qualquer um desses cenários pode ser devastador para os MSPs, testando sua resiliência e a lealdade dos clientes.
Para MSPs, o preparo para possíveis desastres não é uma questão de “se”, mas de “quando”. Como superar um desastre? Prepare-se com antecedência, crie sistemas resistentes e teste-os com frequência.
Neste artigo, mostraremos as medidas práticas que os principais MSPs adotam para lidar com o inesperado.
As empresas precisam de mais do que um plano básico de continuidade de negócios
Como MSP, você sabe a importância do planejamento da continuidade de negócios. Pode ser tentador manter apenas protocolos básicos, mas é preciso ir além. Atenção aos detalhes e atualizações frequentes no plano aumentam suas chances não apenas de sobreviver a um desastre, mas também de prosperar diante dele.
Vá além e confira se sua lista de verificação de continuidade de negócios inclui:
Uma estrutura de comunicação clara.
- Seja claro na atribuição de responsabilidades e na definição de protocolos de comunicação. Quando os sistemas caem, quem se comunica com os clientes? O que eles dizem e com que frequência se comunicam? Faça essa verificação trimestralmente para manter os pontos de contato atualizados.
Listas de recuperação de sistema priorizadas.
- No seu sistema, qual é a cadeia de comando? O que precisa ser restaurado primeiro para minimizar a interrupção? Faça listas de verificação detalhadas e teste-as com frequência.
Defina funções e responsabilidades por nome e não por título ou departamento.
- Em caso de emergência, nada deve ficar sujeito a interpretação. Liste claramente os nomes por responsabilidade e inclua como entrar em contato com cada pessoa (e-mail, identificador do Slack, número de telefone etc.).
Todas na equipe devem saber como acessar o plano de continuidade de negócios (BCP) em caso de emergência. Defina um lembrete de calendário para cada trimestre para revisar protocolos, realizar um teste e conferir se está tudo atualizado.
Objetivos de recuperação que se tornam infraestrutura real
Parte da preparação para desastres é identificar o objetivo de tempo de recuperação (RTO) e o ponto de recuperação (RPO). Depois de defini-los, é preciso construir uma infraestrutura para atender aos padrões estabelecidos.
- RTO significa a rapidez com que você precisa recuperar os sistemas. Deve se basear em dados, não na intuição. Entenda o que até mesmo um minuto de inatividade significa para você e para seus clientes, e, com base nesses números, crie padrões e procedimentos.
- RPO significa a quantidade de dados que você pode se dar ao luxo de perder. Ninguém quer perder dados essenciais, mas é fundamental criar protocolos considerando os piores cenários. Geralmente, o RPO é medido em uma unidade de tempo e define a idade máxima dos dados que podem ser recuperados após uma interrupção (por exemplo, se o RPO for de 5 horas, significa que uma empresa pode tolerar a perda de até 5 horas de dados). O tempo varia de acordo com o cliente e o setor.
Seja preciso e intencional com essas definições. Se o seu RTO é de duas horas, mas a sua solução de backup atual leva seis horas, você se preparou para a falha.
Combine as ferramentas de backup e recuperação de desastres com o RTO e o RPO. Pode ser necessário criar níveis de prioridade para que haja failover quase instantâneo para sistemas essenciais e janelas maiores para os menos essenciais.
Teste quantas vezes for necessário
Só porque está documentado e todos sabem onde encontrar, não significa que funcionará quando for necessário. Um protocolo de backup que nunca foi testado não passa de uma teoria. Crie confiança testando seu plano de continuidade de negócios e seus processos diversas vezes.
Teste como se fosse seu trabalho (que, no caso, é) das seguintes maneiras:
- Realize um exercício teórico de simulação: reúna a equipe, simule diferentes cenários de desastre e pratique as respostas de cada um.
- Faça práticas de restauração surpresa: teste a equipe para saber que ela é capaz de trabalhar sob pressão e recuperar os dados dentro do RTO.
- Documente tudo: crie um relatório detalhado após cada teste e inclua o que funcionou, o que falhou, quais foram os resultados de RTO e RPO e como melhorar da próxima vez (dica de ouro: alimente esses dados no seu sistema de IA para tomar decisões corporativas mais rápidas e informadas)
Transforme os testes de recuperação de desastres em rotina, fortalecendo a confiança da equipe, criando cultura de responsabilidade e conquistando a confiança dos clientes.
Redundâncias intencionais
Às vezes, a redundância é a melhor garantia. Assim como não confiaria em um único método para resolver todos os problemas, você não deve confiar em um único sistema para superar um desastre.
Vá além dos backups de dados e leve em conta o seguinte ao definir seus protocolos:
- Conectividade: tenha vários failovers e provedores de internet; se suas linhas principais caírem, tenha vários outros planos estabelecidos
- Sistemas: considere o uso de replicação em nuvem, bem como servidores e data centers em locais diferentes
- Equipe: faça treinamento cruzado e mantenha contatos de emergência de backup para cada etapa do protocolo de recuperação
A cada trimestre, tire um tempo para revisar os pontos únicos de falha. Onde você confia em apenas um fornecedor, sistema ou indivíduo? Esse é o verdadeiro risco.
Segurança cibernética como primeira linha de defesa
Hoje em dia, os desastres mais comuns dos MSPs são ataques cibernéticos em vez de desastres naturais. As medidas da segurança cibernética moderna devem fazer parte do plano de preparo para desastres e devem incluir:
- Detecção e resposta em terminais (EDR)
- Autenticação de vários fatores (MFA) em todo o ambiente
- Varredura de vulnerabilidades e aplicação de patches frequente e automatizada
- Monitoramento proativo de ameaças
- Conformidade com regulamentos importantes
A tecnologia de segurança cibernética deve estar diretamente ligada ao planejamento de recuperação de desastres. No caso de ransomware e outras ameaças cibernéticas, com que rapidez você consegue isolar, conter e recuperar?
Além disso, muitos clientes de MSP presumem que estão protegidos em termos de segurança cibernética apenas por terem você como provedor. Deixe claro para seus clientes o que eles podem e não podem esperar quando o assunto é segurança cibernética.
Treinamento que deixa tudo alinhado
Quando um desastre ocorre, o problema é de responsabilidade de toda a organização, e não apenas da TI. Toda a equipe do seu MSP deve saber como acessar o plano de continuidade de negócios, compreendê-lo e conhecer sua função em uma crise.
Para promover conformidade e alinhamento do BCP:
- Faça sessões de treinamento para toda a organização e comunique as atualizações importantes do plano
- Seja transparente com os clientes; forneça manuais de desastres que expliquem o que eles podem esperar e o que você precisará deles durante um desastre.
Instruir os clientes e a equipe com consistência fortalece a confiança e a fidelidade de ambos. Assim, você gera confiança e é visto como alguém que investe no sucesso de todos.
Prosperar em qualquer circunstância
Desastres são inevitáveis, mas o fracasso não precisa ser. MSPs com maturidade operacional incorporam o preparo para desastres no centro dos negócios e confiam em sua capacidade de implementar os protocolos que desenvolveram.
Planos de preparo para desastres baseados em dados, testados e mantidos regularmente geram resiliência, fortalecem a confiança e demonstram que seu MSP está preparado para proteger tanto sua empresa quanto a de seus clientes, aconteça o que acontecer.
MSPs que priorizam o preparo para desastres conquistam lucratividade e crescimento de longo prazo, pois clientes valorizam parceiros capazes de enfrentar qualquer desafio.
Quer saber como os MSPs com maturidade operacional chegaram aonde estão? Confira nosso Plano de maturidade de MSP, um recurso gratuito repleto de estratégias para criar um negócio mais inteligente e lucrativo.
