Ich kann Ihnen sagen, was nicht funktioniert: ein manuell bearbeitetes Dokument, eine Tabelle, eine Webseite oder ein Wiki.
Ich habe noch keine Organisation gesehen, die streng genug ist, um ihre technische Dokumentation manuell 100% genau und aktuell zu halten. Eine ungenaue Dokumentation ist nicht nur ärgerlich. Es ist einfach gefährlich. Was passiert, wenn jemand vergisst, dass service a
das läuft server x
? Wenn Sie der Dokumentation vertrauen, kommt es zu unerwarteten Ausfallzeiten von service a
.
Der erste Teil der Lösung besteht darin, den Prozess mithilfe einer Überwachungsplattform wie Xymon, Nagios oder Zabbix zu automatisieren (es gibt viele andere). Es ist möglich, diese Plattformen mit benutzerdefinierten Skripten zu erweitern, um die meisten Fragen zu Ihrer Software und Hardware zu beantworten. Die Überwachungsplattform stellt sicher, dass diese automatische Dokumentation auf dem neuesten Stand gehalten wird.
Der zweite Teil der Lösung besteht darin, einen Mechanismus zu haben, der Sie warnt, wenn Ihre Abdeckung unvollständig ist. Ich verwende beispielsweise ein benutzerdefiniertes Skript, das alle auf einem System ausgeführten Prozesse auflistet, die überwachten oder ignorierbaren Prozesse herausfiltert und mich über unerwartete Prozesse informiert. Dies sagt mir, dass es Zeit ist, diese neuen Prozesse hinzuzufügen die Überwachungsplattform. Ein weiteres Beispiel besteht darin, Ihren Cisco-Portstatus mit CDP-Informationen zu vergleichen, um sicherzustellen, dass Sie alle Ihre Server abgedeckt haben.
Der große Vorteil dieses Ansatzes besteht darin, dass Sie Dokumentation erstellen und kostenlose Benachrichtigungen und Trends erhalten.