Monitoraggio aziendale con Centreon

E' passato molto tempo dall'ultima volta che abbiamo parlato di questo interessante argomento, avere una visualizzazione operativa, Un controllo sul nostro business, Un modo per conoscere lo stato dei servizi che fanno funzionare l'azienda! Volevo fare un post per condividere con voi le possibilità che abbiamo di fronte.

Como bien sabemos, gracias a sistemas de monitorización como pueda ser Centreon, podemos monitorizar nuestra infraestructura. Una monitorización exhaustiva, junto un profundo análisis nos permitirá conocer cualquier punto crítico de la infraestructura que presta un servicio. Estos servicios serán los que ofrecemos a nuestros propios usuarios, clienti o fornitori.

Pues la idea es esa, escalar una monitorización propia de infraestructura a un nivel superior, a un nivel, donde personas no técnicas, si no responsables o ejecutivos que necesiten conocer en tiempo real cómo está su negocio. Unos paneles web que le permitirán saber por qué un servicio operacional pueda verse afectado, que le permita bajar a las tripas y saber por qué las cosas funcionan, unos paneles que le permitan realizar simulaciones del estilo ‘qué pasa sí…’, que conozca el SLA que se le está ofreciendo por cada servicio de negocio

Todo lo que veremos en este post se basa 100% en open source, aunque sí es cierto que Centreon u otros productos puedan ofrecer algo similar bajo productos de pago. In estos posts antiguos ya vimos la parte técnica, cómo montarlo.

Hoy se trata de ver un ejemplo práctico, y pondremos de ejemplo sencillito, mi empresa, “Servizi IT aperti”, una empresa que presta servicios de IT. Così, sabiendo qué necesitamos para que la empresa pueda realizar su desempeño relacionaremos los servicios monitorizados entre sí para crear distintas dependencias.

Entendamos este primer panel, donde el responsable pueda conocer cómo se encuentra el negocio. In questo caso, Affinché l'azienda Open Services IT possa essere produttiva e funzionale, avranno bisogno:

  • Che i tecnici possano assistere i clienti e soddisfare qualsiasi loro esigenza. Questo sarà il servizio di business che chiameremo 'Assistenza Clienti'.
  • Che il dipartimento. di amministrazione possa fatturare, altrimenti, non mangiamo, Questo sarà il nostro servizio di business 'Fatturazione'.
  • Abbiamo anche un elemento importante chiamato 'Continuità aziendale', che sarà qualsiasi servizio che forniamo affinché, in caso di qualsiasi disastro, l'azienda possa continuare a lavorare; o anticiparci a qualsiasi circostanza che ne impedisca il funzionamento.
  • E niente, l'ultimo servizio importante, ma che qui non voglio annoiarvi sarebbe che funzioni l'ambiente 'Domotico', senza di esso, l'azienda non aprirebbe, perderebbe il controllo di alcune automazioni, non verrebbero pagati gli stipendi… Cosa ho detto, non date importanza a questo elemento.

In aggiunta a quanto detto, potremmo indicare nell'interfaccia stessa l'SLA, in % o il tempo di ogni servizio che mostriamo. Potendo vedere quanto tempo è stato OK o perfetto, Avviso o in pericolo, così come Critico o potenzialmente influenzato il servizio.

Il responsabile potrà navigare tra i vari pannelli e conoscere l'SLA che offrono i diversi servizi. In questo esempio vediamo le dipendenze che abbiamo affinché funzioni il “Servizio di assistenza clienti” e si compone dei seguenti elementi:

  • Che il sistema di gestione delle segnalazioni funzioni, affinché il cliente o il tecnico possano gestire, inserire…
  • Mediante el ‘Servicio de Reportingel técnico o cliente podrá conocer en tiempo real el estado de la infraestructura gestionada por nosotros, así como acceso a informes de usos de horas, facturas
  • Tenemos un sistema que permite a los técnicos reunirse con los clientes, obviamente si esto se para, puede verse afectado el ‘Servicio de atención al cliente’. Igualmente lo usamos para las sesiones remotas con los clientes para conectarnos a su puesto
  • Entregamos a nuestros usuarios aplicaciones y escritorios de manera centralizada, para que cualquier empleado pueda trabajar desde cualquier lugar. Si esto no funciona, nadie tiene apps, utensileria…
  • Obviamente los técnicos y los clientes necesitan comunicarse por correo electrónico. Aquí controlaremos todo lo necessario para que funcione el email, que los servidores estén ok, que no estemos en listas de spam…
  • Al igual que el correo, pasa con la telefonía, los técnicos han de poder comunicarse con los clientes (y viceversa). Si el servicio que presta la telefonía cae, pues no hay centralita, o no entran o salen llamadas…
  • Disponemos de un entorno Wiki donde los técnicos consultan a modo KB o documentan any incidencia para no volver a perder tiempo en el futuro. Esto es necesario para el buen trabajo de los technics.
  • Para lo scambio di informazioni con i clienti/fornitori disponemos de un sistema che debe funzionare, sin él no potrebbero accedere a los documentos que tenemos de ellos, facturas, intercambios temporales…
  • ¡Y por supuesto que funcione Internet! senza internet, los técnicos no somos nada 😉

Como vemos el entorno es 100% personalizable y totalmente corporativo, podremos por supuesto añadirle cualquier enlace (a productos…)… Y si seguimos bajando de nivel, podrán ir conociendo lo dicho, todas las dependencias de algo para que funcione. En el caso del ‘Servicio de Reporting’, qué necesitamos para saber que es funcional:

Por un lado debe funcionar internamente:

  • Pues primero, que el propio producto que ofrece el servicio funcione, en este caso se basa en un Grafana, pues que la(s) macchina(s) que ofrecen el servicio estén sanas, así como lo que necesite funcione (porti, Processi, DB…).
  • Nuestro querido ‘Directorio Activodebe funcionar para que el sistema de autenticación y permisos funcione dentro del propio Grafana.
  • Il servizio di virtualizzazione deve funzionare, senza di esso, le macchine virtuali non funzionano, e il nostro Grafana è virtualizzato.
  • La rete interna deve funzionare, se le comunicazioni interne cadono, i sistemi sarebbero influenzati e non potrebbero comunicare tra loro.
  • E altri servizi critici di infrastruttura, come ad esempio il servizio DNS, senza di esso non ci sarebbe risoluzione dei nomi; o il servizio NTP così critico.

E dall'altro lato, essendo un servizio pubblico per i clienti, controlleremo anche che certe dipendenze siano rispettate:

  • Il sito pubblico deve essere operativo, non solo che risponda, ma anche che la porta sia aperta, il certificato non scada, non scada lo stesso dominio, o che lo offrissimo con sicurezza certificata su SSLLABS (non so)…
  • Obviamente si se cae Internet (las WAN que sean), puede que no sea accesible el servicio de Reporting
  • Al igual si disponemos de un balanceador público (en este caso utilizamos NetScaler), pues que funcione, que haga su labor.

Y por hacer el ejemplo más rápido que podía, si en el panel anterior pinchamos en Grafana, pues veríamos las máquinas que ofrecen dicho servicio. Lo comentado, este ejemplo es bastante directo, pero otros servicios permiten viajes más particulares e interesantes. Involtini da parte, vemos la máquina cómo se encuentra, con integraciones y visualizaciones de sus consumos

Análisis de Impacto de Negocio

Podremos tener también un Análisis de impacto de negocio, rápidamente podremos conocer la respuesta ante cualquier duda de ‘qué pasa sí’. Esto significa, Per esempio, que podremos indicar manualmente che algo se cae, así podremos conoscere los servicios afectados. Así podremos anticiparnos a qualsiasi problema, saber qué pasa si quitamos un cable, si nos caduca un certificado, si apagamos una máquina…

Accederemos a este analisi de impacto desde el Home de nuestra monitorización de affair, si os fijáis en la primera immagine del post, abajo a la derecha disponemos de algunos vínculos con distintos accesos, uno será aquí.

La simulación la podremos realizar basándonos en el estado actual de la plataforma, o forzando todo a OK si fuere necesario.

Podremos viajar por los árboles de los procesos de negocio que hayamos definido hasta encontrar qué queremos tirar abajo.

Por seguir el ejemplo del post… qué pasa si se cae por ejemplo el puerto o proceso de Grafana, ¿a qué me afectaría y cómo?

Pues podremos ver cómo el ‘Servicio de Atención al clientese ve afectado, ya que el servicio de Reporting estaría caído

Bene, imaginaros esto con cada proceso de tu empresa, saber cómo actuar, conocer en tiempo real el SLA o Acuerdo de nivel de servicio que estamos prestando a nuestros clientes, usuarios o proveedores. Interfaces de navegación sencilla para cualquier perfil no técnico de la empresa. Pensad que en un post es muy complicado hacer el ejercicio completo, pero pensad en vuestro árbol de dependencias y cómo se puede visualizar en tiempo real su estado.

Come al solito, esperando que os resulte de interés, grazie mille per condividere sui social se vi sembra interessante e continueremo con post simili, esplodiamo i dati e semplifichiamo la loro consegna!

Post consigliati

Autore

nheobug@bujarra.com
Autor del blog Bujarra.com Cualquier necesidad que tengas, Non esitate a contattarmi, Cercherò di aiutarti ogni volta che potrò, Condividere è vivere ;) . Goditi i documenti!!!