Monitorando Jobs de Copia de seguridad o Réplica de Veeam Backup & Replication
Siguiendo con una mentalidad centraladora, hoy veremos cómo des de Centreon poder monitorar l'estat de les còpies de seguretat de Veeam Backup & Replication, con això descargarem otra tarea més a tener en compte en els nostres pensaments, ya que si falla una tarea de còpia o de réplica lo sabremos al moment. No tendremos que estar pendientes més de tener que entrar en la consola para checkearlos,
Bé, nos apoyaremos en un script llamado ‘check_veeam_eventlogs.ps1‘, que anem a descarregar en la màquina encargada de realizar los backups. Un script de PowerShell que senzillament ejecutaremos de forma remota mediante NRPE desde la màquina de Centreon y lleeremos el seu output para monitorar si les tasques de Copia o de Replica se executan bien. Com està clar, primer necessitem tenir NRPE instal·lat i ben configurat a la nostra màquina de Centreon, si no lo tens fet, repassa aquest document.
El funcionament és molt senzill, podem provar a executar des d'una PowerShell, hem deixat el fichero descargado en la carpeta de scripts de NSClient, deberemos pasarle un par de paràmetres al script, un nombre del Job i un altre amb el temps en hores per checkear dins d'aquest temps. Exemple:
[sourcecode].\check_veeam_eventlogs.ps1 ‘Backup Job Open Services IT’ 24[/sourcecode]
El script funciona perfectamente para Jobs de tipo Copia, pero no para los Jobs de tipo Réplica, res, duplicamos el script y a este le renombramos con un ‘_replica’ para tener 2 scripts, uno que monitorizará Jobs de Copia y otros de Réplica (en otro post veremos los Jobs de los EndPoint). En este nuevo fichero realizamos las siguientes modificaciones:
En la línia 35 cambiamos por:
[sourcecode]$ArgEventID = 190 # Replication Job complete event id[/sourcecode]
En la línia 78, reemplazaríamos
[sourcecode]if ($LogEntry.Message.ToString() -like "*Replica*`’$ArgBackupJobName`’*")[/sourcecode]
Y luego ya si queremos dejarlo chulo y cambiar el output por algo más personalizado en Castellano, cambiaríamos la línea 186:
[sourcecode]$ResultString += "CRITICAL: Se encontraron $CriticalErrorResultCount errores criticos en la replica $ArgBackupJobName en las ultimas $ArgLastHours horas"[/sourcecode]
También la línea 192:
[sourcecode]$ResultString += "Warning: La replica $ArgBackupJobName tiene $WarningResultCount mensajes Warning en las ultimas $ArgLastHours horas"[/sourcecode]
La 202:
[sourcecode]$ResultString += "CRITICAL: La replica $ArgBackupJobName acabo con errores en las ultimas $ArgLastHours horas"[/sourcecode]
Y por último la 208:
[sourcecode]$ResultString += "OK: La replica $ArgBackupJobName acabo perfectamente en las ultimas $ArgLastHours horas "[/sourcecode]
Ale, pues lo tenemos listo, now no es més que dar de alta en el fichero nsclient.ini (configuración de NSClient) los alias y comandos que ha d'executar quan le cridem d'un altre equip, com és en el nostre cas des d'un Centreon. Afegim-hi:
[sourcecode][/settings/external scripts/scripts]
check_veeam_copia_os = cmd /c echo scripts\\check_veeam_eventlogs.ps1 ‘Backup Job Open Services IT’ 24; exit($lastexitcode) | powershell.exe -command –
check_veeam_replica = cmd /c echo scripts\\check_veeam_eventlogs_replica.ps1 ‘Replication Job Open Services IT’ 24; exit($lastexitcode) | powershell.exe -command –
…
[/settings/external scripts/àlies]
check_veeam_copia_os = check_veeam_copia_os
check_veeam_replica = check_veeam_replica
…
[/sourcecode]
Reiniciem el servei de NSClient++ de l'equip perquè torni a llegir la configuració i ja anem a Centreon per donar d'alta el Servei que monitoritzarà els Jobs de Còpia i de Rèplica.
Des de “Configuration” > “Services”, Dupliquem qualsevol Servei que tinguem monitoritzat amb NRPE i així serà molt més senzill, l'editem i modifiquem:
- Description: El nom del Servei, per exemple el nom del Job monitoritzat.
- Enllaçat amb Hosts: L'enlacem al servidor que té Veeam instal·lat i NRPE configurat.
- Check Command: Seleccionem el Comandament, si has seguit els documents d'aquest blog, es dirà 'check_nrpe'.
- Argument: A l'argument hem de posar l'Àlies que hem definit al fitxer nsclient.ini perquè s'executi l'script que ens interessi.
I estaria bé indicar en el 'Normal Check Interval'’ que s'executi cada les X hores que ens interessi, òbviament no ens interessa que s'executi el check cada 5 minuts si el job s'executa cada 24h per exemple. Desem el nou servei amb “Save” i podrem crear tants serveis com necessitem per a altres Jobs de Còpia o els de Rèplica…
Desem la configuració & exportem fitxers com és habitual…
I podrem veure després d'una estona que ja tenim monitoritzades les nostres tasques de còpia de seguretat o de replicació! Amb això, otra cosa más centralizada y que podremos controlar y saber en tot momento su estado, además de disrutar de todas las ventajas de un sistema monitorado, podremos medir SLAs…











































