FISL14: Monitoração Usando Software Livre

Nesta palestra de Adair Horst e Fátima Tonon, foi apresentado a solução Zabbix para monitoramento de CPD, como uma visão bem detalhada de conceitos, baseadas na experiência do SERPRO.

Antes de iniciar um monitoramento, é necessário mapear a solução, respondendo perguntas básicas como o que coletar e por quanto tempo guardar as informações coletadas (alguns órgãos públicos tem que guardar essas informações por 10 anos). É muito importante não restringir ao aspecto técnico e não depender de um único fornecedor, sendo que a monitoração é tão importante quanto a segurança de uma organização.

No processo de monitoração é muito importante buscar automatizar os processos, e lembrar que nenhum servidor tem o objetivo de ser monitorado e sim de prover serviços.

As notificações devem ser emitidas para os grupos corretos, em tempo hábil e com o mínimo de falso/positivos, ou seja, evitar nível de alertas excessivamente altos ou insuficientes. Lembrar que a informação deve ser fácil de ser entendida pelo cliente e não apenas pela equipe técnica.

Buscar monitorar a nível de serviço e não máquinas, buscando integração com outras soluções da empresa, como por exemplo, um sistema de tickets.

 

Características

O Zabbix é uma solução de código aberta, sem versões comerciais pagas e atualmente é uma das mais utilizada no mundo. Contudo para entender melhor o seu funcionamento, é necessário entender algumas definições:

Host: é um elemento a ser monitorado, e pode ser uma máquina ou qualquer outro tipo de equipamento;
Template: é um perfil de monitoramento (regras de como monitorar o Apache, como monitorar o MySQL);
Item: é um dado a ser coletado;
Trigger: é um limite definido para receber alertas;
Evento: é um incidente ou problema ocorrido;
Níveis de criticidade: são 6, desde não classificado até o nível desastre.

O controle de acesso é realizado por grupos. Cada usuário tem um grupo e mesmo que um usuário tenha acesso diferenciado, é necessário criar um grupo para esse usuário (mesmo que ele seja o único integrante desse grupo).

Existe dois tipos de auto-busca (semi-automática):
Externa, com varreduras por SNMP, teste de portas, etc;
Interna ou LLD, com varredura nativa, extensível em JSON, que descobre interfaces de rede, sistema de arquivos, etc, de cada máquina;

A partir da versão 2, é possível ter um auto-registro, onde a partir da instalação de um agente ativo, o host é cadastrado automaticamente na monitoração.

Para as notificações, o Zabbix tem integração como Jabber, SMTP, SMS e permite a criação de scripts para integração com outras ferramentas. Como exemplo, tem um script que integra o Zabbix com o Google Calendar.

Ele tem um sistema integrado de Gestão de Incidentes, permitindo escalonar as notificações, sendo possível gerar métricas para ITO.

O Zabbix permite criar mapas personalizados e nesse sentido Adair recomenda criar mapas funcionais, sendo que ele apresentou modelos de:
Mapa operacional (se optar por esse modelo, investir em padronização e tentar agregar valor ao serviço de monitoramento);
Mapa tático, podendo agrupar por máquinas de produção/teste, ou ainda mostrar por aplicação;
Mapa estratégico, menos técnico e que abstrai a infraestrutura, onde é demonstrado o estado dos serviços e aplicativos, muito melhor apresentável ao cliente e mais orientando ao ITO, representando melhor os requisitos do cliente.

É possível estender as funcionalidades, através do Zabbix Extras, como por exemplo, plugin de “Análise de Tendência“, “Correlacionamento de Eventos” e “Árvore Gráfica de Serviço“, esse último criado pelo SERPRO e disponibilizado para a comunidade.

A Árvore de Serviço, apresentado pela Fátima, foi desenvolvido para o Correio Eletrônico do SERPRO, o Expresso, e tem como objetivo representar melhorar o impacto de cada evento. Ele utiliza “pesos” para isso.

Para maiores referências, Adair disponibilizou o link do seu blog, com dicas e artigos sobra o Zabbix, no link: http://spinola.net.br/blog/

Tags: ,

Deixe um comentário