Beim Schreiben meiner habe ich immer zwei drei Sätze geschrieben. Die Checkliste zum Durchstarten mit einem VIEL VERLÄNGERTEN Anhang über die Architektur des Systems, einschließlich der Frage, warum die Dinge so gemacht werden, wie sie sind, wahrscheinlichen Knackpunkten beim Online-Gehen und abstrakten Entwurfsannahmen. gefolgt von einer Liste möglicher Probleme und ihrer Behebung, gefolgt von einem längeren Abschnitt mit Informationen über die Funktionsweise eines Systems und warum dies so ist, sowie weiteren Informationen, die hilfreich sind, um Menschen in die richtige Richtung zu weisen, falls etwas Einzigartiges passiert.
Bei meinem letzten Job mussten wir ein Dokument schreiben, damit selbst Helpdesk-Mitarbeiter der Stufe 1 die Dinge wieder auf den neuesten Stand bringen konnten. Dies erforderte Checklisten, die in der Regel innerhalb von 3 Monaten nach dem Schreiben veraltet waren. Wir wurden dringend gebeten, nach Möglichkeit Fehlerbehebungshandbücher zu schreiben. Wenn der Notfallbaum jedoch mehr als drei Zweige enthält, können Sie dieses Dokument nur schreiben, wenn Sie abstrakt werden.
Als ich meinen letzten Job verlassen habe, habe ich ein 100-seitiges Handbuch zur Erledigung meines Jobs durchgesehen, bevor ich gegangen bin. Es enthielt das Abstrakte, die Designphilosophie sowie Integrationspunkte. Da ich vermutlich für einen anderen Sysadmin schrieb, der mich ersetzen würde, richtete ich mich an jemanden, der abstrakte Vorstellungen aufgreifen und sie in konkrete Handlungen umsetzen konnte.
Fünf Jahre sind vergangen und ich finde, dass sich meine Meinung dazu etwas geändert hat. Sowohl Dokument als Handbuch als auch Dokument als Checkliste haben sehr wertvolle Stellen in der Dokumentationshierarchie und müssen beide erstellt werden. Sie richten sich jedoch an sehr unterschiedliche Zielgruppen.
Dokument als Checkliste
Der Zielmarkt für diese Art von Dokumentation sind Mitarbeiter, die wissen möchten, wie etwas zu tun ist. Sie kommen in zwei Arten:
- Mitarbeiter, die nur wissen wollen, wie man etwas macht und keine Zeit haben, ein fünfzehnseitiges Handbuch durchzublättern und die Schritte selbst herauszufinden.
- Prozeduren, die in Schritten ziemlich komplex sind, aber nur gelegentlich ausgeführt werden müssen.
Ungeduld ist der Treiber für die erste Art. Vielleicht möchte Ihr Kollege gar nicht wissen, warum die Ausgabe über eine Perl-Regex mit 90 Zeichen geleitet werden muss, nur um das Ticket zu schließen. Nehmen Sie auf jeden Fall eine Aussage wie "Eine ausführliche Erklärung, warum dieser Workflow so aussieht, finden Sie unter diesem Link" in die Checkliste für diejenigen, die wissen möchten, warum.
Der zweite Punkt betrifft Prozeduren, die nicht häufig ausgeführt werden, aber Fallstricke enthalten. Die Checkliste fungiert als Karte, um das sichere Schicksal zu vermeiden, sie nur zu beflügeln. Wenn die Checkliste in einem Dokumentations-Repository aufbewahrt wird, muss die E-Mail nicht nach der Zeit durchsucht werden, in der der alte Administrator ein HOWTO gesendet hat.
Meiner Meinung nach enthält eine gute Checklistendokumentation auch Abschnitte über mögliche Fehlerquellen und Antworten auf diese Fehler. Dies kann das Dokument ziemlich umfangreich machen und TL; DR-Antworten bei Mitarbeitern auslösen. Daher ist es meines Erachtens ein Unscary-Checkliste, wenn die Fehlermodi und ihre Antworten als Link von der Checkliste anstatt von der Seite selbst verwendet werden. Umfassen Sie Hypertextualität.
Dokument als Handbuch
Der Zielmarkt für diese Art von Dokumentation sind Menschen, die mehr über die Funktionsweise eines Systems erfahren möchten. Die Dokumentation zur Vorgehensweise sollte sich aus dieser Dokumentation ableiten lassen. Ich sehe sie jedoch häufiger als Ergänzung zur Dokumentation im Checklistenstil, um die im Workflow getroffenen Entscheidungen zu sichern.
Dies ist die Dokumentation, in der wir solche zähen Stücke wie enthalten:
- Erklären, warum es so konfiguriert ist.
- Dieser Abschnitt enthält möglicherweise nicht-technische Themen wie die Politik, wie das Ganze gekauft und installiert wurde.
- Erklären der häufigsten Fehlermodi und ihrer Antworten.
- Erläutern von schriftlichen und tatsächlichen Service-Level-Agreements.
- De facto: "Wenn dies während der Finalwoche fehlschlägt, ist es ein Problem, bei dem alles verloren geht. Wenn Sie während der Sommerpause schlafen gehen und sich morgens darum kümmern."
- Festlegung von Upgrade- und Refactoring-Zielen.
- Die Politik mag später anders sein, warum korrigieren wir nicht einige der schlechten Ideen, die am Anfang eingeführt wurden?
Diese sind alle sehr nützlich, um ein umfassendes Verständnis des gesamten Systems zu erlangen. Sie brauchen kein umfassendes Verständnis, um einfache Aufgaben der menschlichen Automatisierung auszuführen. Sie müssen herausfinden, warum etwas so schief gelaufen ist, und eine Idee haben, wo Sie es dazu bringen können, dies nicht noch einmal zu tun.
Sie haben auch die Disaster Recovery-Dokumentation erwähnt, bei der es sich um eine Checkliste handeln muss.
Ich verstehe, Sie haben mein Mitgefühl.
Ja, die DR-Dokumentation muss so checklistenartig wie möglich sein.
Ja, DR-Dokumentation ist am widerstandsfähigsten gegen Checklisten, da sie auf viele Arten beschädigt werden kann.
Wenn Ihre DR-Checkliste so aussieht:
- Ruf Dustin oder Karen an.
- Erklären Sie das Problem.
- Treten Sie zurück.
Du hast ein Problem. Das ist keine Checkliste, das ist ein Eingeständnis, dass die Wiederherstellung dieses Systems so komplex ist, dass ein Architekt das herausfinden muss. Manchmal ist das alles, was Sie tun können, aber versuchen Sie es zu vermeiden, wenn es überhaupt möglich ist.
Idealerweise enthält die DR-Dokumentation Verfahrensprüflisten für einige verschiedene Dinge:
- Triage-Prozeduren, um herauszufinden, was schief gelaufen ist und um ...
- Wiederherstellungsverfahren für bestimmte Fehlerfälle. Welches wird unterstützt von ...
- Wiederherstellungsskripte, die gut im Voraus geschrieben wurden, um menschliche Fehler während der Wiederherstellung zu minimieren.
- Manuelle Dokumentation über die Fehlerfälle, warum sie auftreten und was sie bedeuten.
Triage-Prozeduren sind manchmal die gesamte DR-Dokumentation, die Sie für einige Systeme erstellen können. Wenn dies jedoch der Fall ist, wird der Anruf um 4 Uhr morgens verständlicher und der leitende Ingenieur, der die Wiederherstellung durchführt, kann das eigentliche Problem schneller lösen.
Einige Fehlerfälle haben einfache Wiederherstellungsverfahren. Dokumentieren Sie sie. Während der Dokumentation finden Sie möglicherweise Fälle, in denen Befehlslisten in einer bestimmten Reihenfolge eingegeben werden. Dies ist ein hervorragender Anwendungsfall für die Skripterstellung. Es kann ein 96-Punkte-Wiederherstellungsverfahren in ein 20-Punkte-Verfahren verwandeln. Sie werden nie herausfinden, ob Sie etwas skripten können, bis Sie die Wiederherstellungsprozedur Aktion für Aktion zuordnen.
Die manuelle Dokumentation für Fehlerfälle ist die letzte Rücklaufsperre, die verwendet wird, wenn keine Wiederherstellungsprozeduren vorhanden sind oder die Wiederherstellungsprozeduren fehlgeschlagen sind. Es bietet die erforderlichen Google-Hinweise, um möglicherweise jemanden zu finden, der dieses Problem hatte, und was er getan hat, um es zu beheben.