Obwohl es ein alter Beitrag ist, antworte ich jetzt, weil ich wusste, dass check_load-Schwellenwerte für die Neulinge viel Kopfzerbrechen bereiten.;)
Eine Warnmeldung, wenn die CPU 5 Minuten lang zu 70%, 10 Minuten lang zu 60% und 15 Minuten lang zu 50% ausgelastet ist. Ein kritischer Alarm, wenn die CPU 5 Minuten lang zu 90%, 10 Minuten lang zu 80% und 15 Minuten lang zu 70% ausgelastet ist.
*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*
Alle meine Erkenntnisse zur CPU-Auslastung:
Was mit "der Ladung" gemeint ist: Wikipedia sagt:
Alle Unix- und Unix-ähnlichen Systeme generieren eine Metrik von drei "Load Average" -Nummern im Kernel. Benutzer können das aktuelle Ergebnis auf einfache Weise über eine Unix-Shell abfragen, indem sie den Befehl uptime ausführen:
$ uptime
14:34:03 up 10:43, 4 users, load average: 0.06, 0.11, 0.09
Ausgehend vom obigen Durchschnitt der Ausgangslast 0.06, 0.11, 0.09
bedeutet : (auf einem Einzel-CPU-System):
- in der letzten Minute war die CPU um 6% unterlastet
- in den letzten 5 Minuten war die CPU 11% unterlastet
- In den letzten 15 Minuten war die CPU zu 9% unterlastet.
.
$ uptime
14:34:03 up 10:43, 4 users, load average: 1.73, 0.50, 7.98
Der obige Lastdurchschnitt 1.73 0.50 7.98
eines Einzel-CPU-Systems als:
- in der letzten Minute war die CPU um 73% überlastet (1 CPU mit 1,73 lauffähigen Prozessen, so dass 0,73 Prozesse auf eine Wende warten mussten)
- in den letzten 5 Minuten war die CPU zu 50% unterlastet (es mussten keine Prozesse auf eine Wende warten)
- In den letzten 15 Minuten war die CPU zu 698% überlastet (1 CPU mit 7,98 lauffähigen Prozessen, so dass 6,98 Prozesse auf eine Wende warten mussten)
Nagios Schwellwertberechnung:
Für das Nagios-CPU-Lade-Setup, das Warnung und Kritisch enthält:
y = c * p / 100
Wo:
y = nagios value
c = number of cores
p = wanted load procent
für ein 4-Kern-System:
time 5 min 10 min 15 min
warning: 90% 70% 50%
critical: 100% 80% 60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4
Für ein Single-Core-System:
y = p / 100
Wo:
y = nagios value
p = wanted load procent
time 5 min 10 min 15 min
warning: 70% 60% 50%
critical: 90% 80% 70%
command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
Ein großartiges Whitepaper zur CPU - Lastanalyse von Dr. Gunther http://www.teamquest.com/pdfs/whitepaper/ldavg1.pdf
In diesem Online - Artikel untersucht Dr. "LA Triplets") werden berechnet und wie angemessen sie als Kapazitätsplanungsmetriken sind.
standard
odertested
Wert. Dies hängt von Ihrer erwarteten Serverauslastung ab. Wenn Sie eine hohe Belastung erwarten, sollten Sie die Werte erhöhen. Andernfalls wird Ihr Server immer in einem kritischen Zustand angezeigt.