Überwachung eines Clusters von Centreon

Sicherlich haben mehr als einer von uns einige Dienste im Clustering, aber, Wie überwachen wir dies mit Centreon? das heißt, in dem Wissen, dass der Cluster seinen Service so anbietet, wie seine Mitglieder ihn anbieten.

ich sagte:, Abhängig von unserer Infrastruktur kann es üblich sein, hohe Verfügbarkeit oder ausgewogene Dienste zu haben., wir sprechen von Aktiv/Aktiv- oder Aktiv/Passiv-Clustern. Bei Aktiv/Aktiv, Wie wir wissen, bieten alle Mitglieder des Clusters ihren Service an, und im Fall von Aktiv/Passiv, Alle Mitgliedsknoten werden normalerweise bis auf einen gestoppt. Aktiv/Aktiv sind vorzuziehen, da sie die Ressourcen im Vergleich zu Aktiv/Passiv ausgleichen und ausnutzen, das zusätzlich, manchmal geben letztere Überraschungen, denn bis Ihre Dienste oben sind, wissen Sie nicht, ob sie funktionieren werden.

Gesamt, In diesem Dokument werden wir sehen, wie überwacht werden kann, ob der Zustand des Clusters gut oder schlecht ist, abhängig von seinen Mitgliedern und dem Status ihrer Dienste.. Dank des Skripts ‚check_cluster‘ Wir können den Status der Gastgeber oder Mitgliederdienste überprüfen.

zum Nougat! Wie man das mit Centreon überwacht… Nehmen wir ein einfaches Beispiel, ein WEB1-Server, ein WEB2, WEB3… sie sind alle Maschinen, die dieselbe Webseite anbieten, von HTTPS. gut, Nun, zuerst werden sie wie üblich überwacht: Individueller Cada-Host, mit Ihren Diensten… und dann können wir damit anfangen 🙂

bevor irgendetwas, Wir installieren das Skript, das wir brauchen werden:

yum installiere nagios-plugins-cluster.x86_64 -y

Und wir gehen direkt zum Erstellen des Befehls. Wir gehen noch nicht zur Schale, heute ist nicht nötig. „Aufbau“ > „Befehle“ > „Prüfen“ > „Erstellen“ und wir werden zwei erstellen. Eine, um die Mitgliederdienste zu überprüfen (des Clusters), und die andere für Mitgliedswirte (des Clusters):

  • Name: check_cluster_services
  • Befehl: /usr/lib64/nagios/plugins/check_cluster –Dienst -l $ARG1$ -w $ARG2$ -c $ARG3$ -d $ARG4$

  • check_cluster_hosts
  • Befehl: /usr/lib64/nagios/plugins/check_cluster –host -l $ARG1$ -w $ARG2$ -c $ARG3$ -d $ARG4$

Die Argumente werden:

  • ARG1 : Es wird die Beschreibung des Dienstes sein, die wir später in der GUI sehen werden.
  • ARG2 : Die Anzahl der gefallenen Mitgliederdienste, die uns als Warnung benachrichtigen.
  • ARG3 : Die Anzahl der ausgefallenen Mitgliederdienste, die uns als Kritisch benachrichtigen.
  • ARG4 : Hier kommt die Sauce dieses Befehls! Wir diskutieren es unten.

Als Nächstes erstellen Sie einen Dienst zur Überwachung des Clusters, zum Beispiel, wenn das Zertifikat alle Mitglieder ordnungsgemäß installiert hat. Wir erstellen den Dienst, wir ordnen es wie immer einer Vorlage zu, und zum neu erstellten Befehl.

Die Argumente Warning und Critical hängen davon ab, wie viele ausgefallene Dienste/Hosts wir zulassen möchten, um uns zu warnen..

das letzte argument, ist das interessante, wird eine Liste der zu kontrollierenden Dienste oder Geräte sein. Wir müssen die Member Services verketten, um das folgende Format einzuchecken: $DIENSTSTATUSID:WEB1:HTTPS-Zertifikat$,$SERVICESTATEID:WEB2:HTTPS-Zertifikat$,$SERVICESTATEID:WEB3:HTTPS$-Zertifikat. Wie können Sie Centreon-Variablen verwenden?, also aus der Schale (noch) wenig können wir tun (und es ist nicht notwendig). Für den Fall, dass Sie die Mitgliedshosts überwachen möchten, das Argument dann werden wir es mit diesem Format füllen: $GASTSTAATEN:WEB1$,$HOSTSTATEID:WEB2$,$HOSTSTATEID:WEB3$

Notiz: Am Ende mit den $SERVICESTATEID-Variablen: o $HOSTSTATEID, was wir erhalten, ist der aktuelle Status dieses Dienstes oder Hosts, das heißt, ein 0 ja es ist in Ordnung, 1 wenn es WARNUNG ist, 2 wenn es KRITISCH ist…

Und nach der Erstellung der vom Cluster angebotenen Dienste hätten wir so etwas. Im Beispiel sehen wir, wäre ein Aktiv/Passiv-Cluster, wobei, obwohl einer der Mitgliedsknoten ausgefallene Dienste hat, Der Cluster ist nicht betroffen, Daher ist Ihre Gesundheit und die Ihrer Dienste in Ordnung.

gut, Ich habe lange nichts von Centreon eingestellt, Ich hoffe, Sie fanden es interessant und es ist eine Möglichkeit, Cluster oder andere Arten von Kombinationen zu steuern, die wir brauchen, Abhängigkeiten zwischen Computern, damit ein Dienst aktiv ist…

Eine fette Umarmung und eine sehr, sehr gute Woche, Pass auf!

Hector Herrero