In letzter Zeit war ich auf einigen der von mir bereitgestellten Drupal-Sites mit Ausfallzeiten konfrontiert. Ich möchte das Problem proaktiv angehen, anstatt auf diese Ausfallzeiten durch einen Neustart der Dienste oder des Servers selbst zu reagieren. Ich habe Informationen zu Überwachungstools wie Nagios, Munin, Cacti usw. zur Überwachung des Zustands Ihres Servers / Ihrer Infrastruktur gelesen, aber ich habe noch keines in der Produktion ausprobiert. Fast 99% der Fälle beschäftige ich mich mit Drupal, und ich möchte Vorschläge sowohl für die Überwachung auf Serverebene als auch für die Überwachung auf Drupal-Ebene (Anwendungscode) herausfinden.
Grundsätzlich möchte ich benachrichtigt werden, wenn die Serverlast hoch ist und möglicherweise auf den Täter (oder das Opfer) hingewiesen wird, damit ich fundierte Entscheidungen treffen kann. Ich würde auch gerne wissen, was die Leute für die Überwachung auf Drupal-Ebene verwenden (z. B. per E-Mail), wenn ein PHP-Fehler / eine PHP-Warnung vorliegt. (Was passiert, wenn der E-Mail-Server selbst nicht verfügbar ist?)