Haftungsausschluss: Ich habe an diesem Projekt gearbeitet, weil ich es als äußerst leistungsfähig empfand. (und ich denke immer noch so)
Ich benutze es seit 2009ish und habe bis auf Legacy-Setups nie wieder ein "normales" (man könnte sagen Legacy) Nagios-Setup berührt. Es würde sich wie Zeitverschwendung anfühlen.
Das größte mir bekannte Setup sind ~ 1200 Überwachungsserver. (nicht: überwachte Server) Dieser wird ebenfalls veröffentlicht, aber die ursprüngliche Frage geht ihm voraus.
Es wird jetzt an ziemlich vielen Orten verwendet, die mit einfachen Nagios im Gegensatz zu größeren NMS wie OpenView nicht zufrieden waren und ihre Meinung geändert haben.
Der Hauptunterschied ist nicht die Skalierbarkeit (wie 37signale zu genießen scheinen) oder die automatische Erkennung von überwachbaren Dingen in einem Remote-System, die alles zu einem Nobrainer macht und Sie sogar benachrichtigt, wenn etwas Neues hinzugefügt wird, aber nicht überwacht wird.
Nein, das wirklich große auf lange Sicht ist die Konfiguration, die streng regelbasiert ist (und als Python geschrieben ist). Ein paar 100 Zeilen Check_MK-Konfiguration reichen aus, um 200.000 Zeilen alter langweiliger Nagios-Syntax zu generieren, auf die Sie nie zurückblicken werden.
- Es hat auch einen webbasierten Konfigurationseditor. Mit Vererbung. Und Validierung.
- Die GUI ist unter anderem für WAN-Verbindungen optimiert. Tatsächlich handelt es sich um ein vollständiges Webframework, weshalb es auch Dashboards und eine Protokollklassifizierungs-Engine gibt, die Syslog oder SNMP für die Nagios-Verarbeitung mit flexiblen Regelsätzen aufnehmen können.
- Alle Schecks werden nach hohen Qualitätsstandards geschrieben und zeigen die für den Benutzer eingesparte Zeit an.
Es gibt jedoch keine Ponys.
- Die Leute sind oft verwirrt über die Interaktion zwischen Check_MK und Nagios, die nicht trivial, aber eigentlich gut getrennt ist: Sie schreibt config, Nagios läuft mit dieser Konfiguration und ruft Check_MK auf, um Systeme zu überwachen.
- Wenn jemand den grafischen Konfigurationseditor "WATO" nicht verwendet, wird davon ausgegangen, dass er sich in Nagios auf Expertenebene befindet.
- Es gibt kein GUI Ops Handbuch! (aber: Inline-Hilfe, die im laufenden Betrieb aktiviert werden kann)
- Perfekt funktionierende IPv6-Support-Patches schweben seit Jahren und sind noch nirgendwo hingegangen.
Es gibt noch viel mehr Vor- und Nachteile, aber ich denke, ich habe beide Seiten bereits recht gut gezeigt. Persönlich mag ich die Effizienz von Check_MK-Setups und bin wirklich verärgert, wenn ich mit Nagsk-Setups von oldskool arbeiten muss. Selbst wenn sie schöne Vorlagen-Frameworks verwenden oder von Puppet kommandiert werden, fühlt es sich im Vergleich zu mir immer noch steinern und hilflos an.
Haftungsausschluss: siehe oben;)