Ein Lastdurchschnitt, der geringer ist als die Anzahl der CPUs, die Sie haben, bedeutet, dass CPUs herum sitzen und nichts zu tun haben. Gleich bedeutet, dass sie alle im Moment arbeiten. Größer bedeutet, dass es Prozesse gibt, die ausgeführt werden könnten, aber in der Warteschlange stehen bleiben.
Für super zeitkritische Dinge wie einen Voip-Server oder einen Memcache soll die durchschnittliche Auslastung deutlich unter der Anzahl der Kerne liegen. Für asynchrone Dinge, die mit gelegentlichen Backups (wie E-Mails) leben können, können Sie problemlos die vierfache Anzahl von Kernen ausführen.
Die größte Einschränkung ist, dass Prozesse, die auf Festplatten- oder Netzwerk-E / A warten, aber ansonsten ausgeführt werden können, weiterhin im Lastdurchschnitt angezeigt werden. Wenn Sie also einen Apache-Server haben, der JPGs an 56.000 Benutzer spoonfeed, können Sie einen viel höheren Lastdurchschnitt ausführen, als wenn er PHP- / Was auch immer-Skript-Antworten auf einen Proxy / Loadbalancer über ein Gigabit-LAN zurückgibt. In Ihrem Fall wird bei einer SMTP-Verbindung zu einem langsamen Mailserver, dessen Übertragung eines Anhangs ewig dauert, ein 1-Prozess in der Ausführungswarteschlange angezeigt, der jedoch zwanzig Mal unterbrochen werden kann, um eine schnelle einzeilige E-Mail ohne Probleme an Google Mail zu senden.
Push kommt zum Schieben, Lastdurchschnitt ist wie beim DOW. Es misst in keiner Weise die "Wirtschaft", die Leute verwenden sie nur als sehr lose korrelierte Metrik, weil es einfach ist, darüber zu sprechen. Konzentrieren Sie sich auf die Überwachung von Metriken, die Ihnen wirklich wichtig sind, z. B. die Tiefe der Übermittlungswarteschlange und Nachrichten pro Sekunde.