Sobre a arquitetura de clusters e alta disponibilidade (RSP, HA)

Prev Next

Este documento apresenta a arquitetura de clusters utilizada pelo Segura, destacando os principais componentes e mecanismos que garantem alta disponibilidade, resiliência e escalabilidade do ambiente de acesso privilegiado. A arquitetura de clusters é fundamental para assegurar que a plataforma opere de forma contínua e segura, mesmo em situações de falhas, manutenção ou aumento da demanda.

Visão geral da arquitetura de cluster

O Segura utiliza uma arquitetura baseada em clusters para garantir alta disponibilidade, resiliência operacional e escalabilidade horizontal. Cada cluster é composto por múltiplos nodes de Remote Session Proxy (RSP), que atuam como pontos de acesso para sessões privilegiadas, balanceando a carga entre si e permitindo failover transparente em caso de falha de algum node.

  • Cluster RSP: Conjunto de servidores responsáveis pelo roteamento, proxy e controle das sessões privilegiadas.
  • Nodes: Cada node processa conexões, autentica usuários, aplica políticas e registra logs das sessões.
  • Gerenciamento centralizado: Toda a configuração e orquestração dos nodes ocorre via console central, com replicação automática de parâmetros e políticas entre todos os membros do cluster.

Alta disponibilidade (HA) nativa

  • Distribuição de sessões: O balanceamento de carga entre os nodes do cluster ocorre automaticamente, utilizando algoritmos internos ou integrando load balancers de terceiros, como F5, HAProxy e balanceadores nativos de cloud.
  • Failover transparente: Caso um node fique indisponível, suas sessões ativas são automaticamente redistribuídas para nodes saudáveis, sem necessidade de intervenção manual e sem impacto para o usuário final.
  • Sincronização em tempo real: Configurações, tokens, políticas e auditoria são sincronizados continuamente entre todos os nodes, garantindo consistência e continuidade mesmo após falhas ou reinicializações.

Benefícios da arquitetura em cluster

  • Escalabilidade horizontal: Possibilita adicionar ou remover nodes conforme a demanda, ajustando a capacidade de processamento e acesso.
  • Resiliência operacional: Minimiza pontos únicos de falha (SPOF) e assegura operações ininterruptas mesmo durante manutenções programadas ou falhas inesperadas.
  • Segurança e compliance: Todos os eventos, comandos e acessos são registrados e auditados de forma distribuída, atendendo a requisitos regulatórios e de auditoria.