Eine umfassendere Liste der Überwachungstools und ihrer Funktionen finden Sie auf dieser Wikipedia-Seite .
Wie die Frage besagt, welche Tools werden für diese Aufgabe am häufigsten verwendet und wo liegen ihre Stärken und Schwächen?
Eine umfassendere Liste der Überwachungstools und ihrer Funktionen finden Sie auf dieser Wikipedia-Seite .
Wie die Frage besagt, welche Tools werden für diese Aufgabe am häufigsten verwendet und wo liegen ihre Stärken und Schwächen?
Antworten:
Ich habe Nagios in der Vergangenheit mit Erfolg benutzt. Es ist sehr erweiterbar (über 200 Add-Ons), relativ einfach zu bedienen und bietet viele Berichte. Ein Negativ wäre die anfängliche Einrichtung.
Cacti ist ein sehr gutes webbasiertes Frontend für RRDTool und bietet sehr nützliche Grafiken und Statistiken. RRDTool ist der Teil, der Daten aus mehreren Systemen sammelt und eine Vielzahl technischer Daten überwacht.
Wir verwenden diese cacti / RRDTool-Lösung zur Überwachung von Unix- und Windows-Systemen. Wir erhalten eine Reihe nützlicher Messdaten, darunter Auslastung, CPU- / RAM-Auslastung, Festplattenspeicher, angemeldete Benutzer, Netzwerkverkehr, laufende Prozesse usw.
Weitere Informationen zu Kakteen finden Sie unter Was sind Kakteen? Seite.
Ich persönlich liebe Munin, das sehr einfach zu installieren und Plugins zu schreiben ist, da es eine sehr einfache Architektur hat. Es gibt bereits ziemlich viele Plugins für alle erdenklichen Zwecke, sodass Sie wahrscheinlich nicht einmal Plugins schreiben müssen.
Es bietet auch schöne Grafiken und die Option, (sehr einfache) Warnungen zu konfigurieren.
Zabbix . Es ist Open Source und relativ einfach einzurichten und anzupassen. Wir haben eine Vielzahl von benutzerdefinierten Überwachungsskripten, die in den zabbix-Server eingespeist werden. Sie kümmern sich jedoch um die Zentralisierung dieser Daten, die angemessene Anzeige dieser Daten, Benachrichtigungen (E-Mail, IM, SMS, Twitter usw.) usw.
Ich habe Spiceworks in unserem Unternehmen eingeführt und wir finden, dass es ein großartiges Tool ist, um nicht nur Server, sondern alles andere im Netzwerk zu überwachen.
Es werden Dinge wie automatische Inventarisierung und benutzerdefinierte Überwachung ausgeführt, um Ihnen E-Mails zu senden, wenn ein Problem auftritt (z. B.: Der Drucker hat bis zu 10% weniger Tinte oder die Festplatte dieses Servers hat 20%).
Der Nachteil ist wahrscheinlich die Informationsdichte pro Computer. Verstehen Sie sich nicht falsch, es gibt VIELE Daten pro Computer, aber für Dinge wie Server, bei denen Sie viele Statistiken benötigen, müssen Sie möglicherweise ein anderes Tool verwenden.
EDIT: Oh, habe ich schon erwähnt, dass sein Geschäftsmodell darauf basiert, dass es für immer frei ist.
Smokeping prüft nicht nur die Verfügbarkeit verschiedener Server und Dienste, sondern verfolgt auch deren Latenz und bietet benutzerfreundliche , gut aussehende und schnell darstellbare Grafiken.
Eine breite Palette von Plug-ins für Latenzmessungen ist sofort verfügbar. Wenn Sie Perl kennen, können Sie ganz einfach eigene Perl-Versionen für alle exotischen Anforderungen erstellen.
Bei großen Installationen wird das Master / Slave-System für verteilte Messungen eingesetzt.
Das hoch konfigurierbare Warnsystem hilft Ihnen, Probleme zu erkennen, bevor sie sich auf Benutzer auswirken oder zu größeren Ausfällen führen.
Smokeping ist kostenlos und OpenSource Software wurde von Tobi Oetiker, dem Entwickler von MRTG und RRDtool, in Perl geschrieben
OpenNMS wird dort eingesetzt, wo ich mehr als tausend Linux-Maschinen überwache. Wir überwachen die Hardware jeder Maschine und die darauf laufenden Anwendungen.
Zenoss Core ist von Nutzen. Wir verwenden es (seit ungefähr einem Jahr) zur einfachen Überwachung von Servern, Netzschaltern und USVs.
Zenoss Core ist ein preisgekröntes Open-Source-IT-Überwachungsprodukt, das die Konfiguration, den Zustand und die Leistung von Netzwerken, Servern und Anwendungen mithilfe eines einzigen integrierten Softwarepakets effektiv verwaltet.
Nagios ist großartig, da es kostenlos ist und es jede Menge Plugins dafür gibt. Die Benutzeroberfläche und Konfiguration ist jedoch sehr schwierig.
Es ist genau das Gegenteil von Pro und Contra, was auch großartig ist: Microsoft System Center Operations Manager (SCOM) ist nicht kostenlos, hat weniger Plugins, aber Setup und Konfiguration sind brillant und einfach.
Ich muss zugeben, dass SCOM meine Empfehlung gegenüber Nagios wäre, wenn ich in einem primären Microsoft-Unternehmen tätig wäre, sehr hohe Anforderungen an die Zuverlässigkeit hätte (dh es mir nicht leisten kann, dass die Überwachung unterbrochen wird) oder wenn ich überlegen müsste, Entwickler dazu zu bringen, damit zu arbeiten.
Ich habe verwendet:
Wir nutzen AlertFox seit einigen Wochen und freuen uns sehr darüber. Es überprüft nicht nur unsere Verfügbarkeit und Leistung, sondern überwacht auch den Warenkorb, die Benutzeranmeldung und andere kritische Teile der Website über Transaktionsskripte (iMacros-basiert).
Für unsere interne Überwachung (Speicherplatz usw.) verwenden wir Nagios .
Als Windows-Person MOM. Wir möchten ein Upgrade auf Systems Center Operations Manager (SCOM) durchführen, müssen dies jedoch erst tun, wenn wir mit der Bereitstellung von Windows 2008 beginnen.
Ich bin Teil eines Upgrades für die Betriebsüberwachung. Wir haben verschiedene Anbieter vor Ort kommen lassen, um ein paar große Dollarsysteme vorzustellen und einige billigere Alternativen zum Vergleich beizufügen.
Eines davon ist Hyperic , das auch als kostenlose Open Source-Lösung erhältlich ist. Ich war beeindruckt von den bereitgestellten Funktionen und der Erweiterbarkeit für benutzerdefinierte Agenten.
Für die Überwachung von Statistiken (Speichernutzung, Auslastung, MySQL-Aktivität, Apache-Aktivität usw.) verwende ich Munin . Im Auslieferungszustand werden bereits viele Dinge verfolgt und Diagramme für verschiedene Zeitintervalle erstellt (letzte 24 Stunden, letzte 7 Tage, letzter Monat, letztes Jahr). Durch Plugins können noch mehr Dinge überwacht werden. Es werden HTML-Seiten mit hübschen Grafiken ausgegeben.
Munin hat eine Master / Node-Architektur: Nodes sammeln Statistiken auf einem Server und der Master speichert die Daten und erstellt HTML und Diagramme.
Ich verwende Monit , um den Überblick über laufende Prozesse zu behalten und mich neu zu starten oder zu benachrichtigen, wenn bestimmte konfigurierbare Bedingungen auftreten (hohe CPU-Auslastung, hohe Speichernutzung, keine HTTP-Antwort usw.). Monit kann auch allgemeinere Dinge über einen Server überwachen, z. B. die CPU Laden, Speichernutzung, Festplattenstatus oder Festplattennutzung.
Monit muss für jeden Dienst oder jede Hardware konfiguriert werden, die Sie überwachen möchten, und wie Sie reagieren, wenn ein Fehler auftritt. Die am häufigsten verwendeten Optionen sind, nichts zu tun, eine Alarm-E-Mail zu senden oder den Dienst neu zu starten.
Monit ist großartig, wenn es funktioniert, aber manchmal kann es einen Dienst nicht starten, stoppen oder neu starten, und es sind nicht viele Diagnoseinformationen verfügbar, die Ihnen mitteilen, was schief gelaufen ist. Dies bedeutet, dass Sie nicht wissen, ob das Problem bei Ihrem Dienst oder bei der Monit-Konfiguration lag, die in einer Cron-ähnlichen Minimalumgebung ausgeführt wird.
Beide Tools sind standardmäßig auf den meisten Linux-Distributionen verfügbar.
Ich bin überrascht, dass niemand Logwatch oder Logcheck für Linux-Server erwähnt hat - spart eine Tonne Zeit beim Lesen von Logs!
Ich verwende Pingdom zur Überwachung meines Servers. Es sendet mir eine SMS-Nachricht, wenn der Server nicht erreichbar ist.
Unser Projekt verwendet Ganglia für unsere über 100 Knotencluster. Ein Grund, warum wir es verwenden, ist, dass es das Überwachungstool ist, das mit Rocks geliefert wird .
Es ist wichtig, dass wir auf jedem Knoten einen sehr geringen Overhead haben, damit so viele Ressourcen wie möglich für die Berechnung zur Verfügung stehen. Ganglia gibt uns einen guten Überblick über den Cluster und ermöglicht es uns, bei Bedarf einen Drilldown zu einzelnen Knoten durchzuführen. Abgesehen davon, dass wir wissen, was gerade los ist, können wir uns ziemlich genau ansehen, was in der letzten Stunde, am letzten Tag, in der letzten Woche, im letzten Monat und im letzten Jahr passiert ist. Die Grafiken verschiedener Statistiken sind grundlegend und funktional.
Es kommt darauf an, was Sie unter "Monitor" verstehen!
Ein neuer Marktteilnehmer, der sich mit Cacti und den RRDTool-basierten Lösungen messen möchte, ist Graphite ( http://graphite.wikidot.com/ ).
RRDTool wird durch einen Hintergrundspeicher mit dem Namen Whisper ersetzt. Die Dokumente geben einen recht guten Überblick darüber, warum sie sich unterscheiden, und ich mag die CLI für Ad-hoc-Grafiken, wenn ich etwas untersuche.
Wir verwenden (und mögen) WhatsUp von Ipswitch für unser relativ kleines Windows-Netzwerk. Es ist einfach einzurichten und relativ einfach zu verwalten und kann sowohl mit Windows-Servern als auch mit Standard-Dingen umgehen.
Für größere Netzwerke, nicht auf Windows ausgerichtete Netzwerke oder Netzwerke mit vielen unterschiedlichen Inhalten empfehle ich von Herzen OpenNMS . OpenNMS-Software ist kostenlos und das Unternehmen verkauft gerne Support- und Implementierungsservices. Es wird auch von einem sehr scharfen Freund vom College geleitet!
Für diejenigen, die das Nagios-Webinterface nicht mögen, gibt es NPC , ein Plugin für Cacti, das die Nagios-Benutzeroberfläche in Cacti verfügbar macht, aber mit einem besseren Aussehen (Ajax usw.).
Es liest aus einer von NDO2DB bereitgestellten Datenbank. Dies ist eine hervorragende Möglichkeit, Ihre Infrastruktur aus einer Datenbank zur Verwendung in Skripten und anderen Tools verfügbar zu machen.
Derzeit verwenden wir PRTG von Paessler . Es ist exzellent. Keine Agenten erforderlich, hervorragende Ajax-Weboberfläche, Protokollierung, grafische Darstellung, WMI usw. Es gibt eine kostenlose 10-Sensor-Version, für die Enterprise-Version haben wir jedoch ein paar Riesen herausgefordert. Geld gut ausgegeben.
Hobbit - es ist eine schnellere, bessere Version von Big Brother (was heutzutage alarmierend kommerziell zu sein scheint).
Wenn Sie es eilig haben und ein schnelles Tool zur Überwachung Ihres MS-Servers benötigen, verwenden Sie die Leistungsüberwachung für Windows. Richten Sie ein Zählerprotokoll mit einer benutzerdefinierten Überwachungsvorlage und einem benutzerdefinierten Zeitplan ein (z. B. stündliche Datenerfassung für 5 Minuten). Laden Sie dann das LogParser- und das Codeplex-Tool zur Leistungsanalyse von Protokollen (PAL) ( http://pal.codeplex.com/ ) von Microsoft herunter, um Ihr Zählerprotokoll zu analysieren . PAL generiert einen großartigen dokumentierten Bericht mit Links zu möglichen Dokumenten / Tools zur Problemlösung.
Ich verwende eine Kombination aus Solarwinds, Registerkarten für die VMware-Serverleistung und benutzerdefinierten Skripts.
Solarwinds Orion Network Performance Monitor ist das, was ich mit unserem Windows-System verwende. Admins auf meinen Webservern. Es werden immer noch einige nützliche App-Metriken ausgeführt, aber es enthält gute Informationen zu grundlegenden Dingen auf Box-Ebene (Festplatte, Netzwerk, CPU).
Für meine VMware-Gäste gefallen mir die Leistungstabellen.
Wenn ich auf meinen Sun-Servern etwas benötige, das in Solarwinds nicht verfügbar ist (weil unser Administrator es nicht hinzugefügt hat oder was), schreibe ich benutzerdefinierte Skripte (normalerweise in Perl), um Dinge wie den Zustand der Spiegelung, die Auslagerungsnutzung usw. zu überwachen.
Ich würde gerne mehr über Solarwinds erfahren, aber es gibt nur ungefähr 26 Stunden pro Tag (so glaubt mein Chef), also finde ich, dass dies ein bisschen einschränkend sein kann ...
Wir verwenden OpsView , das auf Nagios läuft. Mithilfe der Web-Benutzeroberfläche können Sie neue Hostmonitordefinitionen bereitstellen, ohne den SSH-Zugriff zuzulassen, öffentliche Ansichten bereitstellen und Verlaufswerte aufzeichnen zu müssen. Dies ist praktisch, um geeignete Baselines bereitzustellen und zu bestimmen.
Zabbix ( http://www.zabbix.com ) ist ebenfalls gut und einfacher einzurichten als Nagios.
Tut mir leid zu sagen, aber ich habe am Ende viele benutzerdefinierte Skripte verwendet. Obwohl dies alles andere als ideal ist, bezweifle ich, dass es eine allgemeinere Lösung gibt.
Wir haben unsere eigene Überwachungssoftware geschrieben. Unser Code ist bei weitem nicht so ausgefeilt wie ein kommerzielles Paket, aber wir brauchten nicht viel Funktionalität. Es war einfacher, unsere eigenen zu schreiben, als andere Pakete zu untersuchen und zu lernen, wie man sie benutzt. Der Code macht genau das, was wir wollen und ist einfach zu erweitern.