Ich suche nach einer Möglichkeit, Probleme wie Swap-Tod zu diagnostizieren, bei denen ein Speicherausgleich den Swap auffüllt und die gesamte Maschine (wie Apache) tötet.
Ich verwende bereits Kakteen und kann Nagios (obwohl ich es lieber nicht möchte) oder Munin einrichten, aber soweit ich das beurteilen kann, können sie nicht die individuelle Programmnutzung aufzeichnen - nur den Gesamtstatus.
Ich weiß, dass ich alle 30s ein Skript erstellen kann, das auf eine Datei >> verweist, aber ich würde gerne sehen, ob es bereits eine ausgereifte Lösung gibt.
Idealerweise wäre es wieder:
- Speicherverbrauch der Prozesse alle N Sekunden aufzeichnen
- Zeichnen Sie die CPU-Auslastung der Prozesse alle N Sekunden auf
- Support-Charts und Geschichte
- Support-Durchschnittswerte - so wie mysqld am letzten Tag 43% der CPU verbraucht hat und durchschnittlich 400 MB Arbeitsspeicher hat
- Sei frei und Open Source
Prozessnamen sind und sollten nicht im Voraus bekannt sein - die Idee ist, sie nur überwachen zu lassen und dann einen Blick auf die Top-Täter zu werfen.
Mein System ist Linux (OpenSUSE).