Überwachung des SLA von Hosts in Centreon

Wir werden dieses Dokument verwenden, um das zu erfahren % Verfügbarkeit der Maschinen in Centreon überwacht. Wenn wir ein SLA haben (Service Level Agreement) erfüllen, Wir können es vom Centreon aus messen und uns selbst alarmieren. Oh, und wenn Sie Grafana verwenden, sehen wir es auch von dort aus!

ich sagte:, Am Ende dieses Beitrags erfahren Sie, wie Sie das SLA messen, das jede von Ihnen überwachte Maschine bietet, Wir werden jedem Centreon-Host einen Dienst zuordnen, um die Verfügbarkeit dieser Maschine zu ermitteln. Auf diese Weise haben Sie auch den Verlauf und können bei Interesse Benachrichtigungen erhalten, wenn der % ist kleiner als der Wert, an dem Sie interessiert sind. Und am Ende das, wenn Sie Grafana verwenden, um Ihre Centreon-Überwachung anzuzeigen, Ich werde Ihnen sagen, wie ich diese Daten visualisiere, wenn es dir etwas bringt 🙂

sicher, Du bist immer noch interessiert, in es ist Post wir haben etwas Ähnliches gesehen, Wir haben gesehen, wie man das SLA von Centreon Services erhält. Heute spielen die Gastgeber.

Um das SLA zu messen, müssen wir die eigene Datenbank von Centreon abfragen, welches auf MariaDB basiert (o MySQL), Also, wenn Sie es nicht haben, bevor Sie es brauchen Überprüfen Sie diesen Beitrag um Abfragen an jede MySQL-Datenbank durchführen zu können.

sowieso, Denken Sie daran, dass in Centreon das SLA über die GUI eingesehen werden kann „Berichterstattung“ > „Verfügbarkeit“ > „Gastgeber“. Wir werden dieselben Werte erhalten, aber wir werden sie überwachen, das ist das Wichtigste!

wir begonnen! Wie immer beginnen wir mit dem Befehl, Sobald wir diesen ersten Befehl definieren, Wir können es so oft verwenden, wie wir brauchen. Konkret gibt uns dieser Befehl das % dass eine Maschine im OK-Zustand war, die % Zeit, die gut war. Als Argumente trägt es (ich) die Tage, an denen Sie zur Berechnung des SLA zurückblicken möchten, 1 Tag, 7 Tage, 30 Tage, 365 Tage… (ii) der Maschinenname, Ich hätte es wirklich mit einer Centreon-Variablen abfangen und nicht danach fragen können, (iii) den gewünschten Wert für Warnung und (iv) Kritisch, um Sie zu warnen, Unter diesen Werten wird eine Warnung gewertet. Ich überlasse Ihnen das Kommando:

$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "RUNDE WÄHLEN((SUMME(UPTimeGeplant)/($ARG1$ * 86400))*100,2) als porcentaje VON Gastgebern, log_archive_host WO log_archive_host.host_id = hosts.host_id UND hosts.name = '$ARG2$' UND from_unixtime(date_end) > date_sub(jetzt(), INTERVALL $ARG1$ Tag)  bestellen NACH Datum_Ende DESC" -H CENTREON_IP_ADDRESS -d centreon_storage -u 'MYSQL_USER' -p 'MYSQL_PASSWORD' -t 60 --no-querytime -g -l 'SLA' -U % -w $ARG3$: -c $ARG4$: -m 'Das SLA stammt von' -n

Wenn statt % Möchten Sie sehen, wie lange es schon läuft?, Wir können die Abfrage in etwa so ändern:

$CENTREONPLUGINS$/Nagios-Plugins/check_mysql_query.pl -q "WÄHLEN SIE CONCAT(UMHAUEN(STUNDE(sec_to_time(SUMME(UPTimeGeplant))) / 24), 'D_', MOD(STUNDE(sec_to_time(SUMME(UPTimeGeplant))), 24), 'h_', MINUTE(sec_to_time(SUMME(UPTimeGeplant))), 'm') AS Tiempo FROM Gastgeber, log_archive_host WO log_archive_host.host_id = hosts.host_id UND hosts.name = '$ARG2$' UND from_unixtime(date_end) > date_sub(jetzt(), INTERVALL $ARG1$ Tag)  bestellen NACH Datum_Ende DESC" -H CENTREON_IP_ADDRESS -d centreon_storage -u 'MYSQL_USER' -p 'MYSQL_PASSWORD' -t 60 --keine Abfragezeit -T -g -l 'SLA'

Sobald der Befehl erstellt, Wir könnten jetzt so viele Dienste erstellen, wie wir benötigen, und sie mit unseren Hosts verknüpfen, Dieses Beispiel zeigt uns das SLA für den letzten Monat dieser Maschine, Wir erhalten eine Warnung, wenn die SLA unterschritten wird 99% und gibt eine kritische Meldung aus, wenn sie kleiner ist als 95%.

Nach dem Speichern und Exportieren der Centreon-Konfiguration, Jetzt können wir die Ergebnisse sehen. In einem Moment können wir die SLA jedes Teams kontrollieren, messen und verbessern, oder verwenden Sie es, wenn Sie dazu aufgefordert werden. Beachten Sie, dass dieses Skript nicht vor 6 Uhr morgens ausgeführt werden sollte, da Centreon intern in der Datenbank die Daten für diesen Tag nicht generiert hat und uns möglicherweise etwas falsche Informationen liefern., Daher ist es am besten, eine bestimmte Programmierung darauf zu setzen.

Und wenn Sie Grafana haben und Überwachungsdaten sehen, Wir können das SLA basierend auf dem Zeitraum des Diagramms berechnen, für sie, wenn du sie gemacht hast, Es gibt ein Panel, in dem Sie das SLA sehen können.

Wenn wir das Typenfeld bearbeiten ‚Statistiken‘, Ich berechne das SLA, indem ich es beziehe 2 Abfragen, Der erste erhält die Tage der Abfrage (basierend auf dem, was in Grafana ausgewählt wurde, 24h, 1 meine…); und der zweite ermittelt in Sekunden, wie lange sich das Gerät bereits im OK-Zustand befindet. Wenn Sie möchten, werden beide Abfragen ausgeblendet, und es gibt eine dritte Abfrage, die mathematisch ist und die ermittelt % basierend auf diesen beiden Werten. Ich überlasse dir das 2 verwendete Abfragen:

plugin --mode=sql --host=DIRECCION_IP_HONEYPOT --port=9999 --database=chameleon --username=changeme027a088931d22 --password=changeme0f40773877963 --sql-statement=(*) ALS NUMERITO VON log_archive_host, hosts WHERE log_archive_host.host_id = hosts.host_id AND name = 'NOMBRE_DE_HOST' AND $__unixEpochFilter(date_end)

SUMME AUSWÄHLEN(UPTimeGeplant) als TIEMPO_TOTAL FROM log_archive_host, hosts WHERE log_archive_host.host_id = hosts.host_id AND name = 'NOMBRE_DE_HOST' AND $__unixEpochFilter(date_end)

($B / ($EIN * 86400)) * 100

Auf diese Weise können wir die SLA sehen und demonstrieren, die wir für jede Maschine erfüllen, die in unserem Unternehmen Dienste anbietet., Ich erinnere Sie daran, bevor ich einen Link zur Messung des SLA der Dienste einfüge, Es kommt darauf an, was wir brauchen, es wäre die andere Option.

Ich hoffe wie immer, dass es sehr gut läuft, Passen Sie auf sich auf und ich sende Ihnen eine Umarmung!

Hector Herrero
Letzte Artikel von Hector Herrero (Alle anzeigen)