Este documento explica o recurso de Elastic Scaling do Segura, que permite ao cluster ajustar sua capacidade operacional automaticamente ou manualmente conforme a demanda. Essa funcionalidade assegura performance, resiliência e continuidade em ambientes com variação de carga, operações 24x7 e crescimento acelerado.
Definição e objetivo
Elastic Scaling é a capacidade do cluster de adicionar ou remover nodes de forma dinâmica, acompanhando eventos de uso, crescimento do ambiente ou estratégias de alta disponibilidade.
Modos suportados
-
Escalonamento manual: Administradores podem expandir ou reduzir o cluster via interface web, API ou scripts (Terraform, Ansible, CloudFormation). Segue procedimentos do módulo “Deploy e Remoção de Nodes”.
-
Escalonamento automático: O sistema monitora métricas como CPU, memória, sessões ativas e throughput. Com base em thresholds customizáveis, realiza provisionamento ou desligamento de nodes automaticamente, suportando AWS, Azure, GCP e ambientes virtualizados, com integração nativa a ferramentas de orquestração.
Como configurar
Escalonamento manual
- Monitorar métricas pelo dashboard.
- Adicionar ou remover nodes via painel, API ou automação.
- O cluster redistribui sessões garantindo continuidade sem downtime.
Escalonamento automático
- Configurar integração com a plataforma de nuvem, incluindo credenciais e templates.
- Definir parâmetros de escalonamento: thresholds, políticas de expansão/redução e limites.
- O sistema provisiona ou desliga nodes automaticamente, com eventos e logs sincronizados e auditáveis.
Limitações e considerações
- Testar políticas de auto-scaling em ambiente controlado antes da produção.
- Adaptar integração para múltiplos provedores em ambientes híbridos.
- Configurações inadequadas podem causar “flapping”; recomenda-se limites conservadores em ambientes críticos.
Casos de uso
- Gerenciamento automático de picos em campanhas, eventos sazonais ou imprevistos.
- Expansão ou retração rápida para novas filiais, aquisições ou projetos temporários.
- Atendimento a compliance e SLAs com redundância automatizada.
- Operação contínua em ambientes globais ou críticos.
Boas práticas
- Configurar alertas para antecipar sobrecarga.
- Documentar e validar políticas com a equipe de operações.
- Monitorar logs para ajustar thresholds conforme o comportamento do ambiente.