Wir verwenden Nagios, um einige (~ 130) Server zu überwachen. Wir überwachen CPU, Festplatte, RAM und einige andere Dinge auf jedem Server. Ich habe immer SSH verwendet, um die Remote-Befehle auszuführen, nur weil es wenig bis gar keine zusätzliche Konfiguration auf dem Remote-Server erfordert. Installieren Sie einfach Nagios-Plugins, erstellen Sie den Nagios-Benutzer und fügen Sie den SSH-Schlüssel hinzu, in den ich alles automatisiert habe ein Shell-Skript. Ich habe nie über die Auswirkungen der Verwendung von SSH über NRPE auf die Leistung nachgedacht.
Ich bin nicht sonderlich besorgt über die Belastung des Nagios-Servers (es ist wahrscheinlich zu spezifiziert, was es tut, es war nie über 10% CPU), aber wir führen jede Fernprüfung alle 30 Sekunden durch und jeder Server hat 5 verschiedene Prüfungen durchgeführt. Ich gehe davon aus, dass SSH für jede Prüfung mehr Ressourcen benötigt, aber gibt es einen großen Unterschied? (IE genug Unterschied, um die Umstellung auf NRPE zu rechtfertigen).
Wenn dies hilfreich ist, überwachen wir eine Mischung aus physischen Servern (normalerweise mit 8, 12 oder 16 physischen Kernen) und mittleren / großen Amazon EC2-Instanzen.