INTRODUÇÃO
Requisitos
Requisitos por faixa
8 min
1\ ambiente distribuído (produtivo) a arquitetura distribuída da plataforma simon é composta por diferentes tipos de instâncias balanceadas entre inventário , aiops e apm (application performance monitoring) o dimensionamento a seguir define as configurações mínimas recomendadas para ambientes produtivos, considerando a quantidade de itens de configuração (cis) e o equilíbrio entre performance, escalabilidade e custo 1 1 tabela de sizing — balanceada entre inventário / aiops / apm faixa (itens de configuração) master node db worker atom worker apm worker 1 – 1 000 12 vcpu / 24 gb / 200 gb 8 vcpu / 16 gb / 500 gb 4 vcpu / 8 gb / 100 gb opcional — 4 vcpu / 8 gb / 1 tb ssd/nvme 1 001 – 3 000 16 vcpu / 24 gb / 300 gb 8 vcpu / 24 gb / 500 gb 8 vcpu / 16 gb / 100 gb 1x 8 vcpu / 16 gb / 2 tb ssd/nvme 3 001 – 5 000 16 vcpu / 24 gb / 300 gb 8 vcpu / 32 gb / 1 tb 12 vcpu / 16 gb / 100 gb 1x 8 vcpu / 16 gb / 2 tb ssd/nvme 5 001 – 10 000 18 vcpu / 32 gb / 300 gb 16 vcpu / 64 gb / 2 tb 2x 8 vcpu / 16 gb / 100 gb 1x 16 vcpu / 24 gb / 2 tb ssd/nvme 10 001 – 15 000 18 vcpu / 48 gb / 300 gb 16 vcpu / 64 gb / 3 tb 3x 8 vcpu / 16 gb / 100 gb 2x 16 vcpu / 24 gb / 2 tb ssd/nvme 15 001 – 20 000 ≥ 24 vcpu / 64 gb / 400 gb ≥ 24 vcpu / 128 gb / 4 tb ≥ 3x 8 vcpu / 16 gb / 100 gb 3x 16 vcpu / 24 gb / 2 tb ssd/nvme > 20 000 cluster multi master cluster distribuído (storage dedicado) sob medida cluster distribuído (storage dedicado) 1 2 descrição dos componentes master node coordena a orquestração dos fluxos cognitivos, processamento de ia e automação recomendado utilizar disco ssd para agilidade em operações de cache e logs db worker executa operações analíticas e armazenamento em banco de dados (clickhouse) deve priorizar desempenho de i/o e espaço, sendo recomendado disco nvme para ambientes acima de 5 000 cis atom worker responsável por rotinas de coleta, inventário e descoberta de rede (snmp, ping, etc ) exige processamento moderado e boa conectividade de rede apm worker processa métricas, traces e logs de aplicações é o componente mais intensivo em disco , sendo recomendado nvme de alta velocidade pode operar de forma independente ou escalada horizontalmente por pontos de dados coletados 2\ dimensionamento apm por pontos de dados o módulo apm (application performance monitoring) é responsável pela coleta contínua de métricas e telemetria de aplicações devido à natureza de alta ingestão de dados, o seu dimensionamento é baseado na métrica de pontos de dados coletados por hora (pph) e na retenção de histórico 2 1 capacidade base parâmetro valor padrão capacidade inicial suportada até 1 000 000 pontos/hora (pph) configuração base 1 apm worker (4–8 vcpu / 8–16 gb / 1–2 tb nvme) retenção típica 15 a 30 dias escalabilidade horizontal (adição de novos apm workers) métrica de cálculo pph (pontos de dados coletados por hora) o primeiro nível (até 1 000 cis) já suporta 1 milhão de pontos por hora , mantendo retenção de até 15 dias em disco nvme local 2 2 estimativa de armazenamento considerando 1,5 kb por ponto de dado (dados + índices + overhead de compressão) pontos por hora (pph) pontos por dia armazenamento 15 dias armazenamento 30 dias 1 000 000 24 000 000 540 gb 1,1 tb 3 000 000 72 000 000 1,6 tb 3,2 tb 5 000 000 120 000 000 2,7 tb 5,4 tb 10 000 000 240 000 000 5,4 tb 10,8 tb fórmula de referência disco (tb) ≈ (pph × 24 × dias × 1,5 kb) / 10^12 × 1,2 (+20% de folga para picos e reprocessamentos) 2 3 escalonamento horizontal volume apm (pph) apm workers (mín ) cpu/mem por nó disco total sugerido (30 dias) até 1m 1 4–8 vcpu / 8–16 gb 1–2 tb nvme 1–3m 2–3 8 vcpu / 16 gb 3–5 tb 3–5m 3–5 8–16 vcpu / 16 gb 5–8 tb 5–10m 5–10 16 vcpu / 24 gb 10–20 tb >10m sob consulta dimensionamento dedicado object storage + tiering 2 4 diretrizes técnicas i/o é o principal gargalo — priorizar nvme de alta taxa de leitura e escrita cpu escala conforme a complexidade das análises, não o volume bruto de dados downsampling e retention policies são fundamentais para manter custos e performance armazenamento em camadas (tiering) hot (nvme local) dados recentes (0–7 dias) warm/cold (s3, minio ou ceph) dados históricos expansão linear cada novo apm worker adiciona cerca de +1m pph de capacidade 2 5 observações finais o apm pode ser configurado conforme o tipo de contrato ou necessidade operacional em ambientes exclusivamente de inventário e aiops , o apm worker é opcional para projetos com alto volume transacional (telemetria, logs, métricas contínuas), recomenda se mensuração por pontos de dados coletados ao invés do número de cis ambientes com retention maior que 30 dias devem considerar object storage distribuído
