Monitoramento de negócios com o Centreon

Já faz muito tempo que não falamos sobre este interessante tópico, ter uma visualização operacional, Um controlo sobre o nosso negócio, Uma forma de saber o estado dos serviços que mantêm a empresa a funcionar! Eu queria fazer um post para compartilhar com vocês as possibilidades que enfrentamos.

Como bien sabemos, gracias a sistemas de monitorización como pueda ser Centreon, podemos monitorizar nuestra infraestructura. Una monitorización exhaustiva, junto un profundo análisis nos permitirá conocer cualquier punto crítico de la infraestructura que presta un servicio. Estos servicios serán los que ofrecemos a nuestros propios usuarios, Clientes ou fornecedores.

Pues la idea es esa, escalar una monitorización propia de infraestructura a un nivel superior, a un nivel, donde personas no técnicas, si no responsables o ejecutivos que necesiten conocer en tiempo real cómo está su negocio. Unos paneles web que le permitirán saber por qué un servicio operacional pueda verse afectado, que le permita bajar a las tripas y saber por qué las cosas funcionan, unos paneles que le permitan realizar simulaciones del estilo ‘qué pasa sí…’, que conozca el SLA que se le está ofreciendo por cada servicio de negocio

Todo lo que veremos en este post se basa 100% en open source, aunque sí es cierto que Centreon u otros productos puedan ofrecer algo similar bajo productos de pago. Em estos posts antiguos ya vimos la parte técnica, como montá-lo.

Hoy se trata de ver un ejemplo práctico, y pondremos de ejemplo sencillito, mi empresa, “Serviços abertos de TI”, una empresa que presta servicios de IT. Então, sabiendo qué necesitamos para que la empresa pueda realizar su desempeño relacionaremos los servicios monitorizados entre sí para crear distintas dependencias.

Entendamos este primer panel, donde el responsable pueda conocer cómo se encuentra el negocio. Neste caso, para que a empresa Open Services IT possa ser produtiva e funcional, necessitará:

  • Que os técnicos possam atender os clientes e satisfazer qualquer necessidade que tenham. Este será o serviço de negócio que chamaremos ‘Atenção ao Cliente’.
  • Que o depto. de administração possa faturar, caso contrário, não comemos, este será o nosso serviço de negócio ‘Faturação’.
  • Temos também um item importante chamado ‘Continuidade de negócio’, que será qualquer serviço que prestamos para que perante qualquer desastre, a empresa possa continuar a trabalhar; ou anteciparmo-nos a qualquer circunstância que impeça o seu desempenho.
  • E nada, o último serviço importante, mas que aqui não vos quero aborrecer seria que funcione o ambiente ‘Domótico’, sem ele, la empresa no abriría, perdería el control de ciertas automatizaciones, no se cobrarían las nóminas… O que eu disse, no le deis importancia a este ítem.

Adicionalmente lo dicho, podríamos indicar en la propia interfaz el SLA, em % o en tiempo de cada servicio que mostramos. Pudiendo ver cuánto tiempo se ha encontrado OK o perfecto, Warning o en peligro, así como Critical o pudiendo ser afectado el servicio.

El responsable podrá viajar entre los distintos paneles y conocer el SLA que están ofreciendo los distintos servicios. En este ejemplo vemos las dependencias que tenemos para que funcione elServicio de atención al clientey se compone de lo siguiente:

  • Que funcione el sistema de incidencias, para que el cliente o el técnico pueda gestionar, imputar
  • Mediante el ‘Servicio de Reportingel técnico o cliente podrá conocer en tiempo real el estado de la infraestructura gestionada por nosotros, así como acceso a informes de usos de horas, facturas
  • Tenemos un sistema que permite a los técnicos reunirse con los clientes, obviamente si esto se para, puede verse afectado el ‘Servicio de atención al cliente’. Igualmente lo usamos para las sesiones remotas con los clientes para conectarnos a su puesto
  • Entregamos a nuestros usuarios aplicaciones y escritorios de manera centralizada, para que cualquier empleado pueda trabajar desde cualquier lugar. Si esto no funciona, nadie tiene apps, herramientas…
  • Obviamente los técnicos y los clientes necesitan comunicarse por correo electrónico. Aquí controlaremos todo o necessário para que funcione el email, que los servidores estén ok, que no estemos en listas de spam…
  • Al igual que el correo, pasa con la telefonía, los técnicos han de poder comunicarse con los clientes (y vice-versa). Si el service que presta la telefonía cae, pues no hay centralita, o no entran o salen llamadas…
  • Disponemos de un entorno Wiki onde los técnicos consultan a modo KB o documentan qualquer incidência para não voltar a perder tempo no futuro. Esto es necesario para el buen trabajo de los técnicos.
  • Para a troca de informação com os clientes/fornecedores disponemos de um sistema que deve funcionar, sin ele não poderiam aceder a los documentos que temos de eles, facturas, trocas temporais…
  • ¡Y por supuesto que funcione Internet! sem Internet, los técnicos no somos nada 😉

Como vemos el entorno es 100% personalizable y totalmente corporativo, podremos por supuesto añadirle cualquier enlace (a productos…)… Y si seguimos bajando de nivel, podrán ir conociendo lo dicho, todas las dependencias de algo para que funcione. En el caso del ‘Servicio de Reporting’, qué necesitamos para saber que es funcional:

Por un lado debe funcionar internamente:

  • Pues primero, que el propio producto que ofrece el servicio funcione, en este caso se basa en un Grafana, pues que la(s) máquina(s) que ofrecen el servicio estén sanas, así como lo que necesite funcione (Portos, Processos, DB…).
  • Nuestro querido ‘Directorio Activodebe funcionar para que el sistema de autenticación y permisos funcione dentro del propio Grafana.
  • Debe funcionar el servicio de virtualización, sem ele, no corren máquinas virtuales, e o nosso Grafana está virtualizado.
  • A rede interna deve funcionar, se as comunicações internas falharem, os sistemas seriam afetados e não poderiam comunicar entre si.
  • E outros serviços críticos de infraestrutura, como possa ser o serviço DNS, sem ele não haveria resolução de nomes; ou o serviço NTP tão crítico.

E por outro lado, sendo um serviço público para os clientes, pois também controlaremos que certas dependências se cumpram:

  • O site público deve estar operativo, não só que responda, mas também que a porta esteja aberta, o certificado não expire, não expire o próprio domínio, ou o ofereçamos com segurança certificada no SSLLABS (eu não sei)…
  • Obviamente se a Internet cair (as WAN que sejam), pode ser que o serviço de Reporting não esteja disponível…
  • Assim como se tivermos um balanceador público (neste caso utilizamos NetScaler), para que funcione, para que faça o seu trabalho.

E para fazer o exemplo mais rápido que podia, se no painel anterior clicarmos em Grafana, veríamos as máquinas que oferecem esse serviço. O que foi mencionado, este exemplo é bastante direto, mas outros serviços permitem cenários mais particulares e interessantes. Rola de lado, vemos como se encontra a máquina, com integrações e visualizações dos seus consumos…

Análise de Impacto de Negócio

Também poderemos ter uma Análise de Impacto de Negócio, rapidamente poderemos conhecer a resposta a qualquer dúvida de ‘o que acontece se’. Isto significa, Por exemplo, que poderemos indicar manualmente que algo falha, assim podremos conhecer los servicios afectados. Así podremos anticiparnos a qualquer problema, saber qué pasa si quitamos un cable, si nos caduca um certificado, se apagamos uma máquina…

Accederemos a esta análise de impacto desde o Home de nossa monitorização de negócios, si os fijáis na primeira imagem do post, abaixo a direita disponemos de alguns vínculos com distintos acessos, um será aqui.

La simulación la podremos realizar basándonos no estado atual da plataforma, o forçando todo a OK si fuere necessário.

Podremos viajar por los árboles dos processos de negócio que hayamos definido até encontrar o que queremos tirar abaixo.

Por seguir o exemplo del post… qué pasa se se cae por exemplo el puerto o processo de Grafana, Como é que isso me afetaria e de que forma?

Pois poderemos ver como o 'Serviço de Atendimento ao Cliente'’ é afetado, uma vez que o serviço de Reporting estaria inativo…

Poço, imaginem isto com cada processo da vossa empresa, saber como agir, conhecer em tempo real o SLA ou Acordo de Nível de Serviço que estamos a prestar aos nossos clientes, utilizadores ou fornecedores. Interfaces de navegação simples para qualquer perfil não técnico da empresa. Pensem que num post é muito complicado fazer o exercício completo, mas pensem na vossa árvore de dependências e como se pode visualizar em tempo real o seu estado.

Como de costume, esperando que vos seja útil, muito obrigado por partilhar nas redes sociais se acharem interessante e continuaremos com posts semelhantes, ¡explotemos los datos y simplifiquemos su entrega!

Postagens recomendadas

Autor

nheobug@bujarra.com
Autor del blog Bujarra.com Cualquier necesidad que tengas, Não hesite em contactar-me, Vou tentar ajudá-lo sempre que puder, Compartilhar é viver ;) . Desfrute de documentos!!!