Monitoramento no Tactical RMM: checks e alertas

    O monitoramento no Tactical RMM é feito por checks, verificações que rodam dentro do agente em cada máquina e disparam alertas quando algo sai do padrão. São sete tipos nativos (espaço em disco, ping, carga de CPU, memória, check por script, log de eventos do Windows e status de serviço), cada um com seu próprio intervalo, de cerca de 1 minuto até 1 dia. Quando um check falha, o Tactical RMM notifica por e-mail, SMS, painel ou webhook (Slack, Microsoft Teams).

    Abaixo você vê o que cada tipo de check faz, como ajustar os intervalos, quando usar Check em vez de Task, como os alertas são disparados e como aplicar tudo isso em centenas de máquinas com políticas de automação.

    Os tipos de verificação (checks) do Tactical RMM

    Um check é uma verificação que o agente executa de forma recorrente e cujo resultado define o estado da máquina: tudo certo, aviso ou erro. Estes são os sete tipos disponíveis:

    Espaço em disco (Disk Space)

    Verifica o percentual livre de uma unidade (C:, D:, e assim por diante) e dispara alerta quando cai abaixo de limites de aviso e de erro definidos por você. É o check mais usado para evitar que um servidor pare por disco cheio.

    Ping

    Faz ping contra um IP ou hostname a partir do agente e confirma se o destino responde. Serve para vigiar gateways, impressoras de rede, NAS, switches e qualquer dispositivo que não recebe agente, mas precisa estar de pé.

    Carga de CPU (CPU Load)

    Acompanha o uso percentual de processador e alerta quando a média ultrapassa o limite por tempo suficiente. Identifica processos travados, picos sustentados e servidores subdimensionados antes que o usuário reclame de lentidão.

    Memória (Memory)

    Monitora o percentual de memória RAM em uso e avisa quando passa do limite configurado. Útil para flagrar vazamento de memória em aplicações e máquinas que vivem no limite e começam a paginar em disco.

    Check por script (Script Check)

    Roda um script (PowerShell, Batch, Python e outros) e avalia o código de retorno. Você define quais códigos significam informação, aviso ou erro, o que permite monitorar praticamente qualquer condição: certificado vencendo, backup do dia, fila de impressão, status de uma API interna.

    Log de eventos do Windows (Event Log)

    Observa um log do Windows (System, Application, Security) e alerta quando aparece um evento por ID, origem ou tipo. Captura falhas de hardware, erros de serviço e tentativas de logon malsucedidas sem ninguém precisar abrir o Visualizador de Eventos.

    Status de serviço (Service Check)

    Confere se um serviço do Windows está em execução e pode, opcionalmente, tentar reiniciá-lo sozinho ao detectar que parou. Ideal para serviços críticos: SQL Server, agente de backup, antivírus, aplicações de linha de negócio.

    Intervalos: de quanto em quanto tempo cada check roda

    Cada check tem o próprio intervalo de execução, configurável de cerca de 1 minuto até 1 dia. O campo de frequência do check aceita o valor zero, e nesse caso ele herda o intervalo global do agente, cujo padrão fica em torno de 120 segundos. Esse desenho dá controle fino: você acelera o que é crítico e desacelera o que pode esperar.

    Críticos, frequência alta

    Disco de servidor de produção, serviço de banco de dados ou ping de gateway pedem intervalos curtos, na casa de 1 a 2 minutos, para você reagir rápido.

    Rotineiros, frequência baixa

    Verificações de certificado, presença de backup do dia ou conferências diárias podem rodar 1 vez por dia, sem sobrecarregar a máquina nem o servidor.

    Padrão global do agente

    Deixando o intervalo do check em zero, ele segue o valor configurado no agente (cerca de 120 segundos), o que é um bom ponto de partida para a maioria.

    Equilíbrio de carga

    Espalhar os intervalos evita que dezenas de checks disparem no mesmo segundo em um parque grande, mantendo o servidor e a rede folgados.

    Checks vs Tasks: quando usar cada um

    Esta é a dúvida mais comum de quem começa no Tactical RMM. A regra é simples: Check observa e avisa, Task executa e age.

    Use um Check quando

    Você quer vigiar uma condição de forma contínua e ser avisado com base no resultado. O check suporta códigos de retorno custom para níveis de informação e aviso e permite só notificar após um número de falhas consecutivas, o que corta alarme falso. Exemplo: disco abaixo de 10 por cento livre, serviço parado, evento de erro no log.

    Use uma Task quando

    Você quer executar uma ou mais ações em sequência, com agendamento flexível, seja para corrigir algo ou rodar uma rotina. A task é feita para encadear comandos e scripts e tem mais opções de agendamento. Exemplo: limpar arquivos temporários toda madrugada, reiniciar um serviço em janela de manutenção, rodar um script de correção.

    Os dois trabalham juntos no dia a dia: um check detecta o problema e uma task (ou um script de remediação) resolve. Para montar essas rotinas de execução e automação, veja o guia de automação e scripts no Tactical RMM.

    Alertas: e-mail, SMS e webhook (Slack e Teams)

    Detectar não basta, é preciso avisar a pessoa certa. O Tactical RMM entrega os alertas por quatro canais e organiza tudo em templates de alerta, que centralizam destinatários, remetentes e regras:

    E-mail

    Mensagem para os destinatários configurados, com a severidade e o detalhe do que falhou.

    SMS

    Mensagem de texto para números definidos, útil para erros que não podem esperar alguém abrir o e-mail.

    Notificação no painel

    Aviso dentro do próprio painel do Tactical RMM, para a equipe que vive no dashboard.

    Webhook

    Requisição para Slack, Microsoft Teams ou um endpoint próprio, levando os dados do alerta e campos custom.

    Cada alerta carrega uma severidade (informação, aviso ou erro), e alertas de agente atrasado (máquina sumida) são sempre tratados como erro. As ações de alerta vão além de notificar: dá para disparar um webhook ou executar um script automaticamente no agente ou no servidor quando o problema aparece e quando ele é resolvido, fechando o ciclo de detecção e resposta sem intervenção manual.

    Políticas de automação: monitoramento em escala

    Configurar check por check em cada máquina não escala. A resposta do Tactical RMM são as políticas de automação: você define uma vez o conjunto de checks e templates de alerta e aplica por cliente, por site ou por grupo de máquinas. Toda máquina dentro do escopo herda a política, e máquinas novas já nascem monitoradas, sem trabalho manual.

    Os templates de alerta seguem uma hierarquia clara, da mais específica para a mais geral: política aplicada no site, alerta do próprio site, política aplicada no cliente, alerta do próprio cliente e, por fim, o template padrão. Você ainda pode excluir clientes, sites ou máquinas específicas de um template quando precisa de uma exceção. É assim que um MSP mantém centenas de endpoints sob o mesmo padrão de vigilância sem perder o controle.

    Perguntas frequentes

    Quer monitoramento pronto, sem montar o servidor?

    A UNODATA entrega o Tactical RMM gerenciado, com checks, alertas e políticas de automação já configurados, ambiente pronto em até 48 horas, suporte em português e cobrança por faixa de endpoints. Teste grátis por 14 dias.

    Conhecer o Tactical RMM da UNODATA

    Continue lendo em Conceitos e recursos