
CentreonのチェックサービスのSLAの監視
Algo curioso y que depende de las circunstancias puede venir bien puede ser el conocer el SLA de cualquier servicio que estamos monitorizando actualmente en nuestros Centreon. Puede también estar pensado para cuando monitorizamos a nivel de Negocio, para dar visibilidad de su disponibilidad.
ご存知のように, Centreon almacena sus métricas y estados en una BD de MariaDB, podemos sencillamente mediante queries de MySQL sacar en tiempo o en % el estado de un Servicio monitorizado en Centreon. Podremos saber cuánto tiempo (o porcentaje) ha estado en estado OK, 警告, 危うい, Unknown o en Mantenimiento. 何のためですか? まぁ, de todos es sabido que podemos conocer el SLA de cualquier Host o Servicio en Centreon, pero otra cosa es monitorizarlo para alertarnos de cuando este no se cumple, o por ejemplo para visualizarlos en nuestro Servicio de Negocio vía NagVis.
悪くありません, para comenzar sería interesante que si no estás monitorizando queries de MySQL, eches un vistazo a この投稿. Cuando tengas ya el script que permita hacer consultas a BBDD de MySQL, podremos crear los Comandos que necesitamos y cada uno con su tipo de consulta. Ya que unos comandos nos servirán para monitorizar el SLA de Hosts, otros de Servicios, otros nos darán el resultado en tiempo y otros en %, así que dependiendo lo que necesites te dejo aquí ciertas posibilidades:
- SLA de Servicios OK en %:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "ラウンドを選択((和(OKTimeScheduled)/($ARG1$ * 86400))*100,2) as porcentaje FROM log_archive_service, services WHERE log_archive_service.service_id = services.service_id AND description = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) order BY log_id DESC" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA' -U %
- SLA de Servicios OK en Tiempo:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "CONCATを選択(床(時(sec_to_time(和(OKTimeScheduled))) / 24), 'd_', 国防省(時(sec_to_time(和(OKTimeScheduled))), 24), 'h_', 分(sec_to_time(和(OKTimeScheduled))), 'm') AS Tiempo FROM log_archive_service, services WHERE log_archive_service.service_id = services.service_id AND description = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) order BY log_id DESC" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA'
- SLA de Servicios Warning en %:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "ラウンドを選択((和(WARNINGTimeScheduled)/($ARG1$ * 86400))*100,2) as porcentaje FROM log_archive_service, services WHERE log_archive_service.service_id = services.service_id AND description = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) order BY log_id DESC" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA' -U %
- SLA de Servicios Warning en Tiempo:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "CONCATを選択(床(時(sec_to_time(和(WARNINGTimeScheduled))) / 24), 'd_', 国防省(時(sec_to_time(和(WARNINGTimeScheduled))), 24), 'h_', 分(sec_to_time(和(WARNINGTimeScheduled))), 'm') AS Tiempo FROM log_archive_service, services WHERE log_archive_service.service_id = services.service_id AND description = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) order BY log_id DESC" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA'
- SLA de Servicios Critical en %:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "ラウンドを選択((和(CRITICALTimeScheduled)/($ARG1$ * 86400))*100,2) as porcentaje FROM log_archive_service, services WHERE log_archive_service.service_id = services.service_id AND description = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) order BY log_id DESC" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA' -U %
- SLA de Servicios Critical en Tiempo:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "CONCATを選択(床(時(sec_to_time(和(CRITICALTimeScheduled))) / 24), 'd_', 国防省(時(sec_to_time(和(CRITICALTimeScheduled))), 24), 'h_', 分(sec_to_time(和(CRITICALTimeScheduled))), 'm') AS Tiempo FROM log_archive_service, services WHERE log_archive_service.service_id = services.service_id AND description = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) order BY log_id DESC" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA'
- SLA de Hosts Uptime en %:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "ラウンドを選択((和(UPTimeスケジュール)/($ARG1$ * 86400))*100,2) ホストからの割合として, log_archive_host WHERE log_archive_host.host_id = hosts.host_id AND hosts.name = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) date_end DESC で並べ替え" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA' -U %
- SLA de Hosts Uptime en Tiempo:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "CONCATを選択(床(時(sec_to_time(和(UPTimeスケジュール))) / 24), 'd_', 国防省(時(sec_to_time(和(UPTimeスケジュール))), 24), 'h_', 分(sec_to_time(和(UPTimeスケジュール))), 'm') AS Tiempo FROMホスト, log_archive_host WHERE log_archive_host.host_id = hosts.host_id AND hosts.name = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) date_end DESC で並べ替え" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA'
- SLA de Hosts Downtime en %:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "ラウンドを選択((和(DOWNTimeScheduled)/($ARG1$ * 86400))*100,2) ホストからの割合として, log_archive_host WHERE log_archive_host.host_id = hosts.host_id AND hosts.name = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) date_end DESC で並べ替え" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA' -U %
- SLA de Hosts Downtime en Tiempo:
$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "CONCATを選択(床(時(sec_to_time(和(DOWNTimeScheduled))) / 24), 'd_', 国防省(時(sec_to_time(和(DOWNTimeScheduled))), 24), 'h_', 分(sec_to_time(和(DOWNTimeScheduled))), 'm') AS Tiempo FROMホスト, log_archive_host WHERE log_archive_host.host_id = hosts.host_id AND hosts.name = '$ARG2$' AND from_unixtime(date_end) > date_sub(今(), インターバル $ARG 1$ day) date_end DESC で並べ替え" -H 127.0.0.1 -d centreon_storage -u centreon -p CONTRASEÑA_USUARIO_CENTREON -t 60 --no-querytime -T -g -l 'SLA'
Y ahora sólo falta crear tantos Servicios para monitorizar el SLA como nos interese, en este caso práctico, yo los estoy utilizando únicamente para medir el SLA de los Servicios de Negocio, y por tanto para visualizarlos en NagVis. Como argumentos pondremos los días del SLA que nos interesa ver y en el Nombre del Servicio, el nombre único de un Servicio a chequear.
そしていつものように, tras grabar y exportar la configuración, tendremos nuestros servicios SLA listos para chequear mediante una query en la base de datos de Centreon el tiempo o porcentaje del estado de un Servicio.
Y en NagVis, con el Gadget de RawNumbers podremos añadir los ítems SLA monitorizados y quedará más atractivo a la hora de movernos entre mapas y conocer el SLA que ofrece cualquier servicio, ideal para perfiles no 100% técnicos y quieran conocer el estado de su infraestructura en tiempo real.