INTRODUÇÃO
Requisitos
Requisitos por faixa
8 min
documento técnico — dimensionamento (sizing) da plataforma simon 1\ ambiente distribuído (produtivo) a arquitetura distribuída da plataforma simon é composta por diferentes tipos de instâncias (nodes), balanceadas entre as funções de inventário , aiops e apm (application performance monitoring) os requisitos mínimos abaixo consideram 1 máquina de cada tipo obrigatório , podendo ser ampliados conforme o volume de dados, uso de automação e demanda de monitoramento 1 1 tabela de sizing — balanceada entre inventário / aiops / apm faixa (itens de configuração) master node db worker atom worker apm worker 1 – 1 000 8 vcpu / 16 gb / 200 gb 8 vcpu / 16 gb / 500 gb opcional — 4 vcpu / 8 gb / 50 gb opcional — 4 vcpu / 8 gb / 1 tb ssd/nvme 1 001 – 3 000 8 vcpu / 16 gb / 200 gb 8 vcpu / 32 gb / 500 gb 1x 4 vcpu / 8 gb / 100 gb 1x 4 vcpu / 8 gb / 2 tb ssd/nvme 3 001 – 5 000 8 vcpu / 32 gb / 200 gb 8 vcpu / 32 gb / 1 tb 2x 4 vcpu / 8 gb / 100 gb 1x 4 vcpu / 8 gb / 2 tb ssd/nvme 5 001 – 10 000 16 vcpu / 32 gb / 200 gb 16 vcpu / 64 gb / 2 tb 2x 8 vcpu / 16 gb / 100 gb 2x 4 vcpu / 8 gb / 3 tb ssd/nvme 10 001 – 15 000 16 vcpu / 64 gb / 200 gb 16 vcpu / 64 gb / 3 tb 3x 8 vcpu / 16 gb / 100 gb 3x 4 vcpu / 8 gb / 4 tb ssd/nvme 15 001 – 20 000 ≥ 24 vcpu / 64 gb / 400 gb ≥ 24 vcpu / 128 gb / 4 tb ≥ 3x 8 vcpu / 16 gb / 100 gb ≥ 3x 4 vcpu / 8 gb / ≥ 4 tb ssd/nvme > 20 000 cluster multi master db em cluster distribuído sob medida sob medida (storage dedicado) 1 2 notas técnicas master node coordena fluxos cognitivos, automação e ia; requer alta estabilidade db worker executa operações olap (clickhouse) e armazenamento de entidades; sensível a i/o atom worker responsável por rotinas de coleta e inventário (snmp, ping, descoberta de rede); leve em disco, sensível à rede apm worker processa métricas de desempenho e logs; é o componente mais intensivo em disco escalabilidade linear aumento de cis implica principalmente em expansão do db e apm worker 2\ dimensionamento apm por pontos de dados o módulo apm (application performance monitoring) é o subsistema mais impactado por volume de dados por esse motivo, o dimensionamento deve ser realizado considerando pontos de dados coletados por hora (pph) e retenção de histórico 2 1 capacidade base parâmetro valor padrão capacidade inicial suportada até 1 000 000 pontos/hora configuração base 1 apm worker (4 vcpu / 8 gb / 1–2 tb nvme) retenção típica 15 a 30 dias crescimento linear escala horizontal por adição de apm workers métrica principal pph (pontos por hora) o primeiro sizing (starter) é suficiente para até 1 milhão de pontos por hora , considerando coleta contínua, compressão padrão e 15 dias de retenção 2 2 estimativa de armazenamento considerando 1,5 kb por ponto de dado (média + índices + overhead) pontos por hora (pph) pontos por dia armazenamento por 15 dias armazenamento por 30 dias 1 000 000 24 000 000 540 gb 1,1 tb 3 000 000 72 000 000 1,6 tb 3,2 tb 5 000 000 120 000 000 2,7 tb 5,4 tb 10 000 000 240 000 000 5,4 tb 10,8 tb fórmula de referência disco (tb) ≈ (pph × 24 × dias × 1,5 kb) / 10^12 × 1,2 (+20% de folga para picos e reprocessamentos) 2 3 escalonamento horizontal volume apm (pph) apm workers (mín ) cpu/mem por nó disco total sugerido (30 dias) até 1m 1 4 vcpu / 8–16 gb 1–2 tb nvme 1–3m 2–3 4–8 vcpu / 8–16 gb 3–5 tb 3–5m 3–5 8 vcpu / 16 gb 5–8 tb 5–10m 5–10 8–16 vcpu / 16–32 gb 10–20 tb >10m sob consulta dimensionamento dedicado object storage + tiering 2 4 diretrizes de performance i/o é o fator crítico — priorizar nvme de alta taxa de leitura/gravação cpu é proporcional à complexidade dos cálculos, não ao volume bruto downsampling e retention policies são essenciais para custo e estabilidade tiering recomendado dados recentes (hot) nvme local dados históricos (warm/cold) s3, minio ou ceph expansão linear cada novo apm worker adiciona aproximadamente +1m pph de capacidade 2 5 observações complementares o apm pode ser desativado ou isolado em contrato, dependendo da natureza do uso ambientes com foco apenas em inventário e aiops podem operar sem instância apm para contratos com grande volume transacional (telemetria, logs de apis, etc ) , a recomendação é mensurar o dimensionamento com base no volume médio horário (pph)