Nagios – Monitoraggio del nostro servizio aziendale (1/3)

Bene, Bene… tenia ganas de empezar con este tipo de posts y que veamos hasta dove possiamo arrivare con nostri Nagios!! En una serie de 3 documentos veremos cómo poter misurare el SLA que ofrecen distintas capas de nuestra organización. No sólo utilizaremos Nagios para monitorar nuestra Capa de Infraestructura, podemos escalar aprovechándonos de dicha base y monitorar los Servicios Operacionales de su Empresa, esto se consigue interrelacionando los servicios de infraestructura ya monitorizados con las necesidades departamentales, llegando a monitorizar el Servicio de Negocios que da tua empresa.

 

Interesante no solo para la obtención de certificaciones ISO de calidad de servicio o implantación de ITIL… If no por ejemplo para extender nuestra monitorización y dar accesso a nuevos roles. Questo è, ¿por qué nuestr@ CEO no puede tener visualización de cómo está su negocio? Si analizamos todas las dependencias y requisitos que tiene nuestros departamentos (para que sean funcionales) con los servicios de infraestructura que ya hemos monitorizado, podremos mostrarle en unos mapas personalizados y por los que podrá desplazarse y ver el estado de su Negocio así como sus dependencias. Podremos medir en cada Servicio, el Acuerdo de Nivel de Servicio que ofrece visualizando gráficas, además que como es habitual, si se ve afectado, nos alertará en modo Warning o Critico!

 

Es complicado explicarlo en pocas líneas, Ma, beh,, poco a poco y con buena letra que ya verás que al final vas a tenerlo claro!!! Estoy seguro que muchos sabréis de lo que hablo, y sin ser un experto en ello, voy a tratar de intentar aclararlo con un ejemplo. Claro que cada uno podrá definirlo diferente o con más detalle, pero voy a intentar abreviar. Pensemos que somos una fabrica de tuercas, todo un clásico! Somos una pequeña empresa que las producimos y las vendemos online, disponemos de un departamento que gestionará los pedidos de los clientes y otra a la atención final con cliente.

 

Bene, rollos a parte, para dar servicio, tenemos un pequeñito CPD, donde la infraestructura se apoya de un entorno virtual con vSphere, un par de hosts ESXi y una cabina, servidores virtuales Windows que ofrecen por ejemplo impresoras, shares, Banche dati, ERP, CRM, un par de servidores Exchange para el correo, un par de firewalls, un par de routers de 2 distintos ISP… gli utenti hanno thinclient per connettersi e lavorare su un ambiente centralizzato di Citrix dove aprono i loro desktop/app… E senza dimenticare il web, che è esternalizzato in un hosting! Della parte della Fabbrica non parleremo, pensiamo che sia una rete di PLC che già monitoriamo.

 

Pertanto, il business sarà influenzato se uno qualsiasi dei servizi offerti da ogni area non può funzionare, sia se il web non fornisce il servizio di vendite, o non si possono gestire gli ordini sia se non si risponde ai clienti o non si possono produrre dadi.

 

Ora dobbiamo analizzare e vedere quali necessità ha ogni dipartimento affinché possano svolgere il loro servizio, vedere cosa necessitano delle risorse che abbiamo e collegarle tra loro con dei vincoli.

 

Servizi di Business,

Comenzamos a definir cuales son los Servicios de los cuales nuestro negocio depend para que todo funcione correctamente, estos son los denominados Servicios de Negocio; y en mi ejemplo serán:

  • Servicio Venta Online sería todo lo que pueda afectar a que no se vendan productos en nuestro business.
  • Servicio Atención al Cliente abarcaría todo lo que sea comunicación con cliente final.
  • Servicio Logística y Distribución de Pedidos, lo que entendemos que va desde la preparación del paquete al envío a cliente final.
  • Servicio de Producción, todo lo que concierne a que no se puedan fabricar tuercas.

 

 

Servicios Operacionales,

Serán pues, los que permiten que un Servicio de Negocio funzioni correttamente, definiremo tutte las necessità che tenemos para poder operare. En este documento definiremos sólo uno de ellos, usaremos como ejemplo el SERVICIO ATENCION AL CLIENTE. Non male, qué necesitamos para que se pueda atender a los clientes? Pensemos que para ello tenemos unos profesionales que se comunican con los clientes mediante correos electrónicos o llamadas telefónicas, gestionan todo con un ERP además de temas de satisfacción en un CRM. Para que el Servicio de Negocio SERVICIO ATENCION AL CLIENTE sea funcional, deberemos de dar servicio a los usuarios con los siguientes Servicios Operacionales:

 

  • Servicio ERP, será todo lo necesario para que nuestro ERP sea funcional.
  • Servicio CRM al igual que el anterior, este servicio ofrece que los usuarios puedan usar el CRM.
  • Servicio Correo les permitirá disponer a los usuarios la posibilidad de comunicación con los usuarios por esta vía.
  • Servicio Telefonía será todo lo relacionado con que los teléfonos funcionen bien y las chiamate se puedan realizar o ricevere.
  • Servicio Internet les proveerá la posibilidad de hacer consultas necesarias a volte para poder cumplir con sus trabajos.

 

Si cualquier Servicio Operacional no fuese operativo afectaría al SERVICIO ATENCIÓN AL CLIENTE, por tanto indicaré un condicionante tipo AND, ya verás más adelante para que son estos condicionantes 🙂

Desmenuzaremos cada Servicio Operacional que tengamos para llegar a ver qué hace que éste funcione.

 

 

Servicios de Intraestructura,

Los Servicios de Infraestructura son los servicios de más bajo nivel, su cui si basano i Servizi Operativi. In questo documento vedremo come esempio unicamente le necessità del SERVIZIO POSTA. Definiremo quali requisiti devono essere soddisfatti affinché la nostra posta funzioni bene, in questa organizzazione sarebbero i seguenti:

 

 

 

  • Servizio Exchange, Sistema di posta elettronica su cui si basa la posta dell'organizzazione.
  • Servizio Directory Active, senza questo servizio core, i computer degli utenti tra gli altri elementi non sarebbero funzionali, quindi conviene monitorarne lo stato.
  • Servizio DNS, se la risoluzione DNS non funziona nella nostra organizzazione, i client Outlook non potrebbero connettersi nemmeno.
  • Servizio Virtualizzazione, se la piattaforma virtuale è compromessa, obviamente cualquier servizio che ofrecemos desde máquina virtuales se verá afectado.
  • Servicio Comunicaciones Internas serían los ítems que permiten la comunicación entre los PCs clientes y los servidores.

 

 

Sì? Noi???

 

 

Definiría por ejemplo el Servizio Directory Active de la organización relacionando los servicios que hacen que esto funcione y sea operativo, No? Qué hace falta para que sea operativo el servicio que ofrece nuestro AD? O de qué depende para que funcione? En el ejemplo que tengo 2 DCs (Domain Controller) llamados SRVDC01 y SRVDC02, entendendo que bien si uno falla no pasa nada, ya que ambos ofrecen dicho servicio, que el AD dé servicio a los recursos/usuarios. Por tanto defino los servicios que lo componen:

  • Servicio AD SRVDC01
  • Servicio AD SRVDC02

 

¿Qué es el Servicio AD SRVDC01? Serán los servicios que ofrece dicho servidor para que el AD funcione en él, esempio:

  • Servicio SRVDC01
  • Stato di Active Directory
  • Servizi – Rubrica attiva
  • Porta 389tcp – LDAP
  • Puerto 636tcp – LDAPS

 

Los últimos 4 servicios ya nos empiezan a sonar, No? Son los ítems que ya tenemos monitorados desde nuestro Nagios, a que sí? A que tenemos monitorados sus puertos TCP, Servicios de Windows necesarios, o sappiamo che con NRPE possiamo monitorare con scripts lo que sea, tanto un DCDIAG… Todo esto si no lo tienes, lo encontrarás si buscas por el blog :-). Lo que nos queda por aclarar es, Cos'è Servicio SRVDC01? Non male, son los servicios que hacen que ese servidor funcione correctamente, los recursos básicos que le monitoramos, sean su CPU, ARIETE, Disco C o Ping normalmente. A volte, el mismo servidor cumple distintas funciones, por eso es bueno definirlo con su configuración base para luego ser usado en otros Servicios de Infraestructura.

 

Pronto? Pues así habremos definido nuestro primer Servicio de Infraestructura! Ahora nos quedan todos los demás, los que cada organización tenga, definirlos como necesitéis… Lo que nos queda es pensar las interrelaciones que necesitamos, crear las que nos falten directamente en Nagios, ya que muchas cosas que necesita el negocio sicuro que no lo hemos tenido en cuenta. Así que saca papel y lapiz y empieza a relacionar lo que tienes monitorado y la función que desempeñan! saca un buen rato!!

 

Os dejo unos ejemplos/pantallazos de algunos servicios, claro que en cada ambiente serán diferentes o queramos definirlos de forma distinta! Cuando lo documentemos, indicaremos si la relación entre ellos es OR o AND, Si bien obligamos a que se cumplan todos los condicionantes o basta con que uno de ellos este como OK. Según vayas avanzando con la lectura del documento, espero que se vaya entendiendo mejor!

 

Servizio DNS

Este sería un ejemplo de las necesidades que dependen para que el Servicio DNS sea funciona. Abbiamo 2 Servicios DNS corriendo en 2 servidores a los que a parte de monitorizarles lo básico en Nagios también hacemos consultas DNS o verificamos que el Servicio del Windows esté levantado. Fijaros bien en los condicionantes!

 

Servizio Virtualizzazione

Este Servicio de Virtualización define las dependencias para que sea operativo, a parte de utilizar los checkeos de Nagios sobre los hosts ESXi, datastores o que la cabina SAN no tenga problemas, también dependeremos de que el networking interno funcione bien o tengamos suministro eléctrico que verificaremos con los SAI.

 

Servizio Exchange

Y aquí definimos todas las cosas que afectarán a nuestro Servicio Exchange, sabemos que tenemos 2 servidores en alta disponibilidad que tienen Microsoft Exchange Server, ofrecen ambos los mismos servicios, tanto de CAS o Accesso de Clientes como DAG para el bilancio de las bases de datos. Tendremos en cuenta todo lo demás, todo lo que pueda hacer que esto caiga, como el certificado SSL que utilizamos, que no estemos en listas SPAM o que tengamos Internet entre otras cosas más.

 

Servicio Comunicaciones Internas

Otro último esempio sería el Servicio de Comunicaciones Internas, dove in questo caso definisco tutto ciò che deve funzionare affinché ci sia connettività tra i dispositivi e i server, sia con switch che con punti di accesso Wifi.

 

…Etc, and so on… vi lascio questi esempi per iniziare, Ok? Una volta che definiremo tutti i Servizi Operativi e i loro Servizi di Infrastruttura, andremo a creare tutte le dipendenze che ha la nostra attività affinché funzioni correttamente e non ne risenta, analizzeremo i nostri punti critici e come, ad esempio, la scadenza di un certificato possa influire sul fermare l'attività. Il nostro obiettivo è quello di fare in modo che i responsabili dell'attività possano avere un altro punto di vista su ciò che il nostro dipartimento IT apporta all'attività, mostrando informazioni sulle necessità, perché dobbiamo a volte comprare un'altra cabina, and so on… è un modo molto interessante per giustificare e dimostrare il nostro lavoro! Questo insieme ai report di crescita, possiamo creare dei rapporti impressionanti!

 

 

Post consigliati

Autore

nheobug@bujarra.com
Autor del blog Bujarra.com Cualquier necesidad que tengas, Non esitate a contattarmi, Cercherò di aiutarti ogni volta che potrò, Condividere è vivere ;) . Goditi i documenti!!!