Sobre Elastic Scaling

Prev Next

Este documento explica o recurso de Elastic Scaling do Segura, que permite ao cluster ajustar sua capacidade operacional automaticamente ou manualmente conforme a demanda. Essa funcionalidade assegura performance, resiliência e continuidade em ambientes com variação de carga, operações 24x7 e crescimento acelerado.

Definição e objetivo

Elastic Scaling é a capacidade do cluster de adicionar ou remover nodes de forma dinâmica, acompanhando eventos de uso, crescimento do ambiente ou estratégias de alta disponibilidade.

Modos suportados

  • Escalonamento manual: Administradores podem expandir ou reduzir o cluster via interface web, API ou scripts (Terraform, Ansible, CloudFormation). Segue procedimentos do módulo “Deploy e Remoção de Nodes”.

  • Escalonamento automático: O sistema monitora métricas como CPU, memória, sessões ativas e throughput. Com base em thresholds customizáveis, realiza provisionamento ou desligamento de nodes automaticamente, suportando AWS, Azure, GCP e ambientes virtualizados, com integração nativa a ferramentas de orquestração.

Como configurar

Escalonamento manual

  • Monitorar métricas pelo dashboard.
  • Adicionar ou remover nodes via painel, API ou automação.
  • O cluster redistribui sessões garantindo continuidade sem downtime.

Escalonamento automático

  • Configurar integração com a plataforma de nuvem, incluindo credenciais e templates.
  • Definir parâmetros de escalonamento: thresholds, políticas de expansão/redução e limites.
  • O sistema provisiona ou desliga nodes automaticamente, com eventos e logs sincronizados e auditáveis.

Limitações e considerações

  • Testar políticas de auto-scaling em ambiente controlado antes da produção.
  • Adaptar integração para múltiplos provedores em ambientes híbridos.
  • Configurações inadequadas podem causar “flapping”; recomenda-se limites conservadores em ambientes críticos.

Casos de uso

  • Gerenciamento automático de picos em campanhas, eventos sazonais ou imprevistos.
  • Expansão ou retração rápida para novas filiais, aquisições ou projetos temporários.
  • Atendimento a compliance e SLAs com redundância automatizada.
  • Operação contínua em ambientes globais ou críticos.

Boas práticas

  • Configurar alertas para antecipar sobrecarga.
  • Documentar e validar políticas com a equipe de operações.
  • Monitorar logs para ajustar thresholds conforme o comportamento do ambiente.