Monitoratge de Negoci amb Centreon
Hace tiempo que no hablamos de este tema tan interesante, el tener una visualización operacional, un control sobre el nostre negoci, una manera de conèixer el estado de los servicios que mantienen la empresa funcionando! Me apetecía hacer un post para compartiros las posibilidades a las que nos enfrentamos.
Como bien sabemos, gracias a sistemas de monitorización como pueda ser Centreon, podemos monitorizar nuestra infraestructura. Una monitorización exhaustiva, junto un profundo análisis nos permitirá conocer cualquier punto crítico de la infraestructura que presta un servicio. Estos servicios serán los que ofrecemos a nuestros propios usuarios, clients o proveïdors.
Pues la idea es esa, escalar una monitorización propia de infraestructura a un nivel superior, a un nivel, donde personas no técnicas, si no responsables o ejecutivos que necesiten conocer en tiempo real cómo está su negocio. Unos paneles web que le permitirán saber por qué un servicio operacional pueda verse afectado, que le permita bajar a las tripas y saber por qué las cosas funcionan, unos paneles que le permitan realizar simulaciones del estilo ‘qué pasa sí…’, que conozca el SLA que se le está ofreciendo por cada servicio de negocio…
Todo lo que veremos en este post se basa 100% en open source, aunque sí es cierto que Centreon u otros productos puedan ofrecer algo similar bajo productos de pago. En estos posts antiguos ya vimos la parte técnica, cómo montarlo.
Hoy se trata de ver un ejemplo práctico, y pondremos de ejemplo sencillito, mi empresa, “Open Services IT”, una empresa que presta servicios de IT. Així que, sabiendo qué necesitamos para que la empresa pueda realizar su desempeño relacionaremos los servicios monitorizados entre sí para crear distintas dependencias.
Entendamos este primer panel, donde el responsable pueda conocer cómo se encuentra el negocio. En aquest cas, perquè l'empresa Open Services IT pugui ser productiva i funcional, necessitarà:
- Que els tècnics puguin atendre els clients i satisfer qualsevol necessitat que tinguin. Aquest serà el servei de negoci que anomenarem ‘Atenció al Client’.
- Que el departament. d'administració pugui facturar, si no, no mengem, aquest serà el nostre servei de negoci ‘Facturació’.
- Tenim també un ítem important anomenat ‘Continuïtat de negoci’, que serà qualsevol servei que prestem perquè davant de qualsevol desastre, l'empresa pugui continuar treballant; o anticipar-nos a qualsevol circumstància que impedeixi el seu rendiment.
- I res, l'últim servei important, però que aquí no vull avorrir-vos seria que funcioni l'entorn ‘Domòtic’, sense ell, la empresa no abriría, perdería el control de ciertas automatitzacions, no se cobrarían las nóminas… El que s'ha dit, no le deis importància a este ítem.
Adicionalmente lo dicho, podríamos indicar en la propia interfície el SLA, en % o en tiempo de cada servei que mostramos. Pudiendo ver cuánto tiempo se ha trobat OK o perfecto, Warning o en peligro, así como Critical o pudiendo ser afectado el servei.
El responsable podrá viatjar entre els distintos panells i conèixer el SLA que están ofreciendo los distintos servicios. En aquest exemple vemos las dependències que tenemos para que funcione el “Servicio de atención al cliente” y se compone de lo següent:
- Que funcione el sistema de incidencias, para que el client o el técnico pueda gestionar, imputar…
- Mediante el ‘Servicio de Reporting’ el técnico o cliente podrá conocer en tiempo real el estado de la infraestructura gestionada por nosotros, así como acceso a informes de usos de horas, facturas…
- Tenemos un sistema que permite a los técnicos reunirse con los clientes, obviamente si esto se para, puede verse afectado el ‘Servicio de atención al cliente’. Igualmente lo usamos para las sesiones remotas con los clientes para conectarnos a su puesto…
- Entregamos a nuestros usuarios aplicaciones y escritorios de manera centralizada, para que cualquier empleado pueda trabajar desde cualquier lugar. Si esto no funciona, nadie tiene apps, herramientas…
- Obviamente los técnicos y los clientes necesitan comunicarse por correo electrónico. Aquí controlaremos tot lo necessari para que funcione el email, que los servidors estén ok, que no estemos en llistes de spam…
- Al igual que el correo, pasa con la telefonía, los tècnics han de poder comunicarse amb els clients (i viceversa). Si el servei que presta la telefonía cae, pues no hay centralita, o no entran o salen llamadas…
- Disposem de un entorno Wiki on los tècnics consultan a modo KB o documentan qualsevol incidència para no tornar a perdre temps en el futur. Esto es necessary para el buen trabajo de los técnicos.
- Para l'intercanvi d'informació amb els clients/proveedores disposem de un sistema que debe funcionar, sin ell no podrien accedir a els documents que tenemos de ells, facturas, intercanvis temporals…
- ¡Y por supuesto que funcione Internet! sense Internet, los técnicos no somos nada 😉
Como vemos el entorno es 100% personalizable y totalmente corporativo, podremos por supuesto añadirle cualquier enlace (a productos…)… Y si seguimos bajando de nivel, podrán ir conociendo lo dicho, todas las dependencias de algo para que funcione. En el caso del ‘Servicio de Reporting’, qué necesitamos para saber que es funcional:
Por un lado debe funcionar internamente:
- Pues primero, que el propio producto que ofrece el servicio funcione, en este caso se basa en un Grafana, pues que la(s) màquina(s) que ofrecen el servicio estén sanas, así como lo que necesite funcione (ports, processos, BBDD…).
- Nuestro querido ‘Directorio Activo’ debe funcionar para que el sistema de autenticación y permisos funcione dentro del propio Grafana.
- Debe funcionar el servicio de virtualización, sense ell, no corren máquinas virtuales, y nuestro Grafana está virtualizado.
- La red interna debe funcionar, si se caen las comunicaciones internas, los sistemas se verían afectados y no se podrían comunicar entre sí.
- Y otros servicios críticos de infraestructura, como pueda ser el servicio DNS, sin él no habría resolución de nombres; o el servicio NTP tan crítico.
Y por el otro lado, al ser un servicio público a los clientes, pues también controlaremos que ciertas dependencias se cumplen:
- El sitio público debe estar operativo, no sólo que responda, si no también que el puerto esté abierto, el certificado no caduque, no caduque el propio dominio, o lo ofrezcamos con seguridad certificada en SSLLABS (yo qué sé)…
- Obviamente si se cae Internet (las WAN que sean), puede que no sea accessible el servei de Reporting…
- Al igual si disponem de un balanceador público (en aquest cas utilitzamos NetScaler), pues que funcione, que haga el seu labor.
I per fer l'exemple més ràpid que podia, si en el panel anterior pinchamos en Grafana, pues veríamos las màquines que ofrecen dit service. Lo comentado, aquest exemple és força directe, però altres serveis permeten viatges més particulars i interessants. Rollos a parte, vemos la màquina com se encuentra, amb integracions i visualitzacions de seus consumos…
Anàlisi d'impacte de negoci
Podremos tener també un Anàlisi d'impacte de negoci, ràpidament podrem conèixer la resposta ante qualsevol dubte de 'qué pasa sí'. Esto significa, per exemple, que podrem indicar manualment que alguna cosa es caï, així podrem conèixer els serveis afectats. Así podremos anticiparnos a qualsevol problema, saber què passa si quitamos un cable, si ens caduca un certificat, si apagamos una màquina…
Accederemos a aquesta anàlisi d'impacte des de la Llar de la nostra vigilància de negocis, si els fijáis en la primera imatge del post, abajo a la derecha disponem de algunos vínculos con distintos accesos, Uno será aquí.
La simulación la podremos realizar basándonos en el estado actual de la plataforma, o forçando todo a OK si fuere necesario.
Podremos viajar por los árboles de los procesos de negoci que hayamos definido hasta encontrar qué volem tirar abajo.
Por seguir l'exemple del post… qué pasa si se cae por ejemplo el puerto o proceso de Grafana, ¿a qué me afectaría y cómo?
Pues podremos ver cómo el ‘Servicio de Atención al cliente’ se ve afectado, ya que el servicio de Reporting estaría caído…
Bo, imaginaros esto con cada proceso de tu empresa, saber cómo actuar, conocer en tiempo real el SLA o Acuerdo de nivel de servicio que estamos prestando a nuestros clientes, usuarios o proveedores. Interfaces de navegación sencilla para cualquier perfil no técnico de la empresa. Pensad que en un post es muy complicado hacer el ejercicio completo, pero pensad en vuestro árbol de dependencias y cómo se puede visualizar en tiempo real su estado.
Com sempre, esperando que os resulte de interés, que muchas gràcies por compartir en xarxes socials si os sembla interessant i seguirem amb posts similars, ¡explotem los dades i simplifiquem la seva entrega!
















































