Monitorando um cluster do Centreon
Certamente mais de um de nós tem algum serviço em agrupamento, mas, Como monitoramos isso com o Centreon?? Isto é, Saiba que o cluster oferece seu serviço porque seus membros o oferecem.
O que eu disse, puede ser habitual dependiendo de nuestra infrastructure tener servicios en alta disponibilidad o balanceados, hablamos de clústers de tipo Activo/Activo o Activo/Pasivo. En el caso de los Activo/Activo, como sabemos todos los miembros del clúster oferecem su service, y no caso de los Activo/Pasivo, todos los nodos miembros suelen estar detenidos a exceção de uno. Los Activo/Activo são preferíveis ya que se balancea y aproveitan los recursos frente a los Activo/Pasivo, que además, a vezes estes últimos dan surprises, ya que hasta que no se levantan sus serviços no sabes se vão a funcionar.
Total, en este documento vamos a ver como monitorizar que a saúde do clúster é boa o mala dependendo dos seus membros e o estado dos serviços dos mesmos. Gracias al script ‘check_cluster’ podremos consultar el estado de los Hosts o Servicios miembros.
¡Al turrón! Cómo monitorizar con Centreon esto… pongamos un ejemplo sencillo, un servidor WEB1, un WEB2, WEB3… todos son máquinas que ofrecen la misma página web, Por HTTPS. Poço, pues primero será tenerlos monitorizados como es habitualmente: Individual cada Host, con sus Servicios… y luego ya podremos comenzar con esto 🙂
Em primeiro lugar, instalamos el script que vamos a necesitar:
yum install nagios-plugins-cluster.x86_64 -y
Y vamos directamente a crear el Comando. Todavía no vamos a bajar a shell, hoy no es necesaria. “Configuração” > “Comandos” > “Verificar” > “Criar” y crearemos dos. Uno para comprobar los servicios miembros (del clúster), y el otro para los hosts miembros (del clúster):
- Nome: check_cluster_servicios
- Comando: /usr/lib64/nagios/plugins/check_cluster –service -l $ARG1$ -w $ARG2$ -c $ARG3$ -d $ARG4$
- check_cluster_hosts
- Comando: /usr/lib64/nagios/plugins/check_cluster –host -l $ARG1$ -w $ARG2$ -c $ARG3$ -d $ARG4$
Os argumentos serão:
- ARG1 : Será a descrição do serviço que veremos depois na GUI.
- ARG2 : O número de serviços membros inativos que nos alertará como Warning.
- ARG3 : O número de serviços membros inativos que nos alertará como Critical.
- ARG4 : Aqui vem o molho deste comando! Comentamo-lo a seguir.
O seguinte será criar um Serviço a monitorizar no cluster, por exemplo se o certificado estiver bem instalado em todos os seus membros. Criamos o serviço, associamo-lo como sempre a um template, e ao comando recém-criado.
Os argumentos de Warning e Critical dependerão de quantos serviços/hosts fora de serviço queremos permitir antes de nos alertar.
O último argumento, é o interessante, será uma lista de serviços ou equipamentos a monitorizar. Temos de concatenar os Serviços membros a verificar no seguinte formato: $SERVICESTATEID:WEB1:Certificado HTTPS$,$SERVICESTATEID:WEB2:Certificado HTTPS$,$SERVICESTATEID:WEB3:Certificado HTTPS$. Como podem ver, utiliza variáveis do Centreon, portanto desde o terminal (ainda) pouco podemos fazer (e não é necessário). No caso de querer monitorizar os Hosts membros, o argumento depois será preenchido neste formato: $HOSTSTATEID:WEB1$,$HOSTSTATEID:WEB2$,$HOSTSTATEID:WEB3$
Nota: No final, com as variáveis $SERVICESTATEID: ou $HOSTSTATEID, o que obteremos será o estado atual desse Serviço ou Host, Isto é, um 0 se é OK, 1 se é WARNING, 2 se é CRITICAL…
E depois de criar os serviços que o cluster oferece, ficaria algo assim. No exemplo que vemos, seria um cluster Ativo/Passivo, onde, apesar de um dos nós membros ter os serviços em baixo, o cluster não é afetado, portanto a sua saúde e a dos seus serviços está OK.
Poço, há muito tempo que não postava algo sobre Centreon, espero que vos tenha parecido interessante e é uma forma de controlar clusters ou outro tipo de combinações que precisemos, dependências entre máquinas para que um serviço esteja ativo…
Um beijinho grande e que a semana corra muito, muito bem, cuidem-se!













































