- 3 minutos de leitura
- Imprimir
- Tema escuroTema claro
- Pdf
Como realizar um Teste de Recuperação de Desastres
- 3 minutos de leitura
- Imprimir
- Tema escuroTema claro
- Pdf
Neste artigo, você encontra um guia passo a passo sobre como realizar um teste de Recuperação de Desastres (DR) executando um failover manual.
Para realizar este teste com sucesso, o membro Primário deve ser desligado de forma abrupta.
Requisitos
Duas instâncias do senhasegura devem estar disponíveis.
As instâncias devem estar no mesmo cluster e operando corretamente. Para mais informações sobre as configurações de um cluster, consulte o artigo Como criar um cluster.
Tirar um snapshot de ambas as instâncias.
Este teste é destinado a duas instâncias como membros do cluster. Antes de iniciar, certifique-se de verificar as seguintes tags na parte inferior de cada um dos membros:
Membro A (Principal):
Application: Produção e Habilitado.
Replication: Primário.
Membro B (Secundário - contingência)
Application: Contingência e Desabilitado.
Replication: Não primário (Non-primary).
Passo 1: Tirar snapshots
Antes de realizar o teste, é crucial tirar um snapshot das instâncias como precaução, pois o desligamento abrupto pode causar danos.
Sempre tire os snapshots na ordem reversa do cluster. Neste caso, tire primeiro o snapshot do Membro B e, posteriormente, do Membro A.
Para tirar um snapshot, siga estes passos:
- Acesse a instância.
- Execute o seguinte comando para desligá-la:
sudo orbit shutdown
- Quando a instância estiver completamente desligada, tire o snapshot no hipervisor.
- Em seguida, reinicie a instância e verifique se o funcionamento foi reestabelecido.
Passo 2: Validar o cluster
- Acesse Orbit Config Manager > Replicação > Elasticsearch.
- Na tabela Cluster de pesquisa de dados, e na tabela Membros do cluster, verifique se o tamanho do cluster corresponde a 2.
Passo 3: Configurar o Recovery
- No Membro B, acesse Orbit Config Manager > Configurações > Recuperação.
- Insira os IPs permitidos para executar a recuperação do sistema.
Certifique-se de não utilizar Wildcards (*).
Esta lista tornará o botão Assumir como Primário visível para os usuários.
Ao utilizar máscaras de sub-rede, deve-se adotar a notação CIDR, por exemplo, 192.168.1.0/24
.
Passo 4: Executar o Teste de Recuperação de Desastres
- Force um desligamento abrupto no Membro A.
Certifique-se de que seja um desligamento abrupto; caso contrário, o cluster detectará a desativação e o Membro B não irá exibir a página de Recovery.
Uma vez que o Membro A esteja inativo devido a um comportamento inesperado, o Membro B entrará em split brain, bloqueando qualquer alteração de banco de dados até que instruções manuais sejam aplicadas.
Em seguida, a página de Recovery será exibida na aplicação web.
Clique em Assumir como Primário.
Confirme clicando em Sim. Isso configurará o Membro B como o novo membro Primário. Esse processo pode levar alguns minutos.
Certifique-se de que o botão apareça; caso contrário, consulte Como habilitar o Recovery para garantir que os IPs estejam configurados corretamente.
Assim que a interface Orbit Web estiver disponível no Membro B, verifique se a tag está indicando que esta instância é agora o membro Primário.
Para acessar os demais módulos do senhasegura, é necessário habilitar a aplicação. Vá para Orbit > Configurações > Aplicação e alterne o botão Ativar aplicação para a posição ativa.
Clique em Salvar.
Se a cor verde for apresentada, então a aplicação estará ativada.
- Faça logoff e login novamente para acessar os outros módulos.
Após seguir estes passos, todas as funcionalidades do senhasegura estarão disponíveis e operacionais no Membro B de DR.
Passo 5: Recuperar o Membro Primário
- Ative o Membro A e aguarde a sincronização com o outro banco de dados do cluster. Isso pode levar alguns minutos.
O Membro A identificará o problema, e o Membro B, atualmente Primário, iniciará a sincronização automática das novas informações entre os membros.
Após a sincronização, a página de login será exibida na interface principal da aplicação web.
Faça login na aplicação web do Membro A e clique em Assumir como Primário para restaurá-lo como como membro Primário.
No Membro B, vá para Orbit Config Manager > Configurações > Aplicativo e alterne o botão Ativar aplicativo para a posição inativa.
Clique em Salvar.
Certifique-se de que a cor verde não esteja sendo exibida.
Passo 5.1 (alternativo): Recuperar o Membro Principal via SSH
Inicie uma sessão SSH no Membro A utilizando a porta 59022 com o usuário
mt4adm
.Execute o comando
sudo orbit application status
para verificar as seguintes informações:
sudo orbit application status
Application: Active
Replication: Active
Instance: Cluster
Primary: memberB
Main: No
- Em seguida, execute o comando
sudo orbit application primary
para definir o Membro A como Primário:
sudo orbit application primary
Application: Active
Replication: Active
Instance: Cluster
Primary: memberA
Main: Yes