Este documento apresenta a arquitetura de clusters utilizada pelo Segura, destacando os principais componentes e mecanismos que garantem alta disponibilidade, resiliência e escalabilidade do ambiente de acesso privilegiado. A arquitetura de clusters é fundamental para assegurar que a plataforma opere de forma contínua e segura, mesmo em situações de falhas, manutenção ou aumento da demanda.
Visão geral da arquitetura de cluster
O Segura utiliza uma arquitetura baseada em clusters para garantir alta disponibilidade, resiliência operacional e escalabilidade horizontal. Cada cluster é composto por múltiplos nodes de Remote Session Proxy (RSP), que atuam como pontos de acesso para sessões privilegiadas, balanceando a carga entre si e permitindo failover transparente em caso de falha de algum node.
- Cluster RSP: Conjunto de servidores responsáveis pelo roteamento, proxy e controle das sessões privilegiadas.
- Nodes: Cada node processa conexões, autentica usuários, aplica políticas e registra logs das sessões.
- Gerenciamento centralizado: Toda a configuração e orquestração dos nodes ocorre via console central, com replicação automática de parâmetros e políticas entre todos os membros do cluster.
Alta disponibilidade (HA) nativa
- Distribuição de sessões: O balanceamento de carga entre os nodes do cluster ocorre automaticamente, utilizando algoritmos internos ou integrando load balancers de terceiros, como F5, HAProxy e balanceadores nativos de cloud.
- Failover transparente: Caso um node fique indisponível, suas sessões ativas são automaticamente redistribuídas para nodes saudáveis, sem necessidade de intervenção manual e sem impacto para o usuário final.
- Sincronização em tempo real: Configurações, tokens, políticas e auditoria são sincronizados continuamente entre todos os nodes, garantindo consistência e continuidade mesmo após falhas ou reinicializações.
Benefícios da arquitetura em cluster
- Escalabilidade horizontal: Possibilita adicionar ou remover nodes conforme a demanda, ajustando a capacidade de processamento e acesso.
- Resiliência operacional: Minimiza pontos únicos de falha (SPOF) e assegura operações ininterruptas mesmo durante manutenções programadas ou falhas inesperadas.
- Segurança e compliance: Todos os eventos, comandos e acessos são registrados e auditados de forma distribuída, atendendo a requisitos regulatórios e de auditoria.