Marcos hat einen schönen Lebenslauf mit den wichtigsten Punkten der WARTUNG erstellt: Überwachung, Backups und Updates.
Ich muss (durch Kommentare von Leuten) diese Überwachung wiederholen! = Wartung.
Ich möchte hinzufügen: Bereinigungen alter Benutzer, alte Cron-Aufgaben usw. Erneuerungen von Passwörtern. Entwicklung der Systemkonfiguration (mit Blick auf den Überwachungsverlauf) (und dies schließt die Entwicklung der Überwachung und Sicherungen ein) mit den Änderungen der Lebensdauer des Servers. Sicherheitsprüfungen . Benutzerdefinierte Berichte (dh detaillierte Nutzung von Diensten, freigegebenen Ressourcen, Sicherheitsberichten). Und...
Stellen Sie Backups nach dem Zufallsprinzip wieder her (ohne dass dies erforderlich ist). Fügen Sie auch immer eine Kopie des MBR (Master Boot Record) bei, wenn Sie kein automatisiertes Bereitstellungssystem verwenden, um den gesamten Server wiederherzustellen.
Ich habe gesehen, dass Firewalls 500 Tage Betriebszeit überleben (ja, das ist eine schlechte Wartung, da es ungefähr 10/15 Kernel-Upgrades pro Jahr gibt, so dass große Betriebszeiten einem anfälligen Kernel entsprechen ), ohne dass eine menschliche Wartung erforderlich ist . Es ist nur eine gute Konfiguration für Partitionen, Syslog und keine größeren Konfigurationsänderungen.
Sie fragen nach Skripten . Vielleicht gibt es generische vorgefertigte Skripte, aber es geht mehr um DIY (Do It Yourself). Also zuerst Sie lernen oder lesen , wie das System funktioniert (dies schließt Distro spezifische Reames, Manpages, Richtlinien und Kompilierungsoptionen), dann yo denken , wie Ihr System verhalten soll, und dann Sie schreiben benutzerdefinierte Skripts (cron, benutzerdefinierte Befehle, usw.) Verwalten Sie die Kombination aus Betriebssystem + gewünschtem Verhalten / Ergebnissen / Berichten / Änderungsmanagement / Rollbacks / Reaktionen / etc.
Auch erhältlich generische Werkzeuge (monit, nagios, Kakteen, zabbix, usw.) kann erweitert mit scripting Fähigkeiten und verfügbar Dritten Plugins .
Beispiel: Müssen Sie nur wissen, ob die Partition voll ist, oder müssen Sie auch die Festplattentemperatur, die freien Inodes, die Rechte an Dateien und Ordnern, die Prüfsummen, den SMART-Status, fehlerhafte Sektoren, Dateisystemprüfungen und den geschätzten Lebenszyklus von steuern physische Hardware?
Neben den Backups sollten das Überwachungssystem und die Anpassungen nach Möglichkeit validiert werden, um Fehler, Angriffe usw. zu simulieren.
Benutzerdefinierte Skripte sind besser, wenn Sie sie überprüfen und Fehler auf einem Vorproduktionsserver, einer Umgebung, einem Verzeichnis, einer Datenbank usw. beseitigen können.