Ich habe Firmware-Upgrades in HP Switches durchgeführt. Zwei verschiedene Modelle wurden aktualisiert:
- ProCurve Switch 5406zl Intelligent Edge (J8697A): Upgrade von K.15.06.0008 auf K.15.12.0012
- HP 2520-24G-PoE-Switch (J9299A): Upgrade von J.14.54 auf J.15.09.0021
Beim Überprüfen jedes Schalters direkt nach dem Booten des neuen Images habe ich Folgendes festgestellt:
- Switches luden das neue Firmware-Image fehlerfrei und die Konnektivität wurde wiederhergestellt, sobald der Switch hochgefahren wurde. Zu diesem Zeitpunkt war die CPU-Auslastung gering (unter 10%).
- Wenige Sekunden später stieg die CPU-Auslastung auf 100% und blieb einige Minuten dort. Ich konnte zu diesem Zeitpunkt kein Problem feststellen, außer dass CLI über SSH etwas träge ist: normale Konnektivität, keine Protokollnachrichten ...
- Nach fünf bis zehn Minuten bei 100% war die CPU ohne Änderung von meiner Seite wieder normal.
Beide Modelle hatten dieses Verhalten. Ich habe eine Einheit jedes Modells auf das vorherige Firmware-Image zurückgesetzt, und sie haben sich genauso verhalten.
Obwohl diese CPU-Spitze direkt nach dem Booten kein Problem verursachte, frage ich mich, ob normales Netzwerkverhalten die Ursache für diese Spitze sein könnte, aber ich denke nicht. Ich habe folgende Aspekte berücksichtigt:
Unmittelbar nach dem Start startet STP, generiert BPDUs und wechselt alle Ports im Switch durch die Zustände Bloking, Listening, Learning und Forwarding. Selbst mit 802.1D dauert dieser Vorgang mit Standard-Timern jedoch nicht länger als 1 Minute. Außerdem habe ich die Switches über SSH überprüft, sodass alle STP-Berechnungen bereits durchgeführt wurden, als ich eine Verbindung zum Switch herstellen konnte.
Unmittelbar nach dem Start ist die MAC-Adresstabelle leer und für die Weiterleitung der ersten Frames ist eine Übertragung erforderlich. Ich bezweifle jedoch, dass diese Übertragung bei einem 24-Port-Switch 100% CPU und noch viel weniger 5 Minuten dauern würde.
Alle Switches, die als L2-Geräte fungieren, haben keine L3-Funktionalität aktiviert, daher verwerfe ich Routing und andere L3-Prozesse.
Vermisse ich etwas "Normales" im Netzwerkbetrieb, das diese CPU-Auslastung für 5 Minuten nach dem Neustart erklären kann, während die Konnektivität erhalten bleibt? Vielleicht ist es eine Art Hintergrundprozess, den der Switch direkt nach dem Neustart ausführt?