监控 Veeam Backup Backup 或 Replication 作业 & 复制

Siguiendo con una mentalidad centralizadora, hoy veremos cómo desde Centreon poder monitorizar el estado de las copias de seguridad de Veeam Backup & 复制, con esto descargaremos otra tarea más a tener en cuenta en nuestros pensamientos, ya que si falla una tarea de copia o de réplica lo sabremos al momento. No tendremos que estar pendientes más de tener que entrar en la consola para checkearlos,

 

不错, nos apoyaremos en un script llamadocheck_veeam_eventlogs.ps1‘, que vamos a descargar en la máquina encargada de realizar los backups. Un script de PowerShell que sencillamente ejecutaremos de forma remota mediante NRPE desde la máquina de Centreon y leeremos su output para monitorizar si las tareas de Copia o de Replica se ejecutan bien. Como está claro, primero necesitamos tener NRPE instalado y bien configurado en nuestra máquina de Centreon, si no lo tienes hecho, 检讨 本文档.

 

操作非常简单, podemos probarlo a ejecutarlo desde una PowerShell, habremos dejado el fichero descargado en la carpeta de scripts de NSClient, deberemos pasarle un par de parámetros al script, uno el nombre del Job y otro con el tiempo en horas para checkear dentro de ese tiempo. 例:

[源代码].\check_veeam_eventlogs.ps1 ‘Backup Job Open Services IT’ 24[/源代码]

 

El script funciona perfectamente para Jobs de tipo Copia, pero no para los Jobs de tipo Réplica, 无, duplicamos el script y a este le renombramos con un ‘_replicapara tener 2 脚本, uno que monitorizará Jobs de Copia y otros de Réplica (en otro post veremos los Jobs de los EndPoint). En este nuevo fichero realizamos las siguientes modificaciones:

在线 35 cambiamos por:

[源代码]$ArgEventID = 190 # Replication Job complete event id[/源代码]

 

在线 78, reemplazaríamos

[源代码]如果 ($LogEntry.Message.ToString() -like "*Replica*`’$ArgBackupJobName`’*")[/源代码]

 

Y luego ya si queremos dejarlo chulo y cambiar el output por algo más personalizado en Castellano, cambiaríamos la línea 186:

[源代码]$ResultString += "CRITICAL: Se encontraron $CriticalErrorResultCount errores criticos en la replica $ArgBackupJobName en las ultimas $ArgLastHours horas"[/源代码]

 

También la línea 192:

[源代码]$ResultString += "Warning: La replica $ArgBackupJobName tiene $WarningResultCount mensajes Warning en las ultimas $ArgLastHours horas"[/源代码]

 

La 202:

[源代码]$ResultString += "CRITICAL: La replica $ArgBackupJobName acabo con errores en las ultimas $ArgLastHours horas"[/源代码]

 

Y por último la 208:

[源代码]$ResultString += "OK: La replica $ArgBackupJobName acabo perfectamente en las ultimas $ArgLastHours horas "[/源代码]

 

啤酒, pues lo tenemos listo, ahora no es más que dar de alta en el fichero nsclient.ini (configuración de NSClient) los alias y comandos que debe ejecutar cuando le llamemos de otro equipo, como es en nuestro caso desde un Centreon. 加:

[源代码][/设置/外部脚本/脚本]
check_veeam_copia_os = cmd /c echo scripts\\check_veeam_eventlogs.ps1 ‘Backup Job Open Services IT’ 24; 退出($lastexitcode) | powershell.exe -command –
check_veeam_replica = cmd /c echo scripts\\check_veeam_eventlogs_replica.ps1 ‘Replication Job Open Services IT’ 24; 退出($lastexitcode) | powershell.exe -command –

[/设置/外部脚本/别名]
check_veeam_copia_os = check_veeam_copia_os
check_veeam_replica = check_veeam_replica

[/源代码]

 

Reiniciamos el servicio de NSClient++ del equipo para que relea la configuración y ya nos vamos a Centreon para dar de alta el Servicio que monitorizará los Jobs de Copia y de Réplica.

 

因为 “配置” > “服务业”, duplicamos cualquier Servicio que tengamos monitorizado con NRPE y así será mucho más sencillo, 我们对其进行编辑和修改:

  • 描述: El nombre del Servicio, por ejemplo el nombre del Job monitorizado.
  • Lined with Hosts: Lo enlazamos al servidor que tiene Veeam instalado y NRPE configurado.
  • Check 命令: Seleccionamos el Comando, si has seguido los documentos de este blog, se llamará ‘check_nrpe’.
  • Argument: En el argumento debemos poner el Alias que hemos definido en el archivo nsclient.ini para que ejecute el script que nos interese.

 

Y estaría bien indicar en el ‘Normal Check Intervalque se ejecute cada las X horas que nos interese, obviamente no nos interesa que se ejecute el checkeo cada 5 minutos si el job se ejecuta cada 24h por ejemplo. Grabamos el nuevo servicio con “救” y podremos crear tantos servicios como necesitemos para otros Jobs de Copia o los de Réplica

Grabamos la configuración & exportamos ficheros como es habitual

 

Y podremos ver tras un rato que ya tenemos monitorizado nuestras tareas de copia de seguridad o de replicación! 有了这个, otra cosa más centralizada y que podremos controlar y saber en todo momento su estado, además de disrutar de todas las ventajas de un sistema monitorizado, podremos medir SLAs

 

推荐文章

作者

nheobug@bujarra.com
Autor del blog Bujarra.com Cualquier necesidad que tengas, 请随时与我联系, 我会尽我所能帮助你, 分享就是生活 ;) . 享受文档!!!