Nach einem Kaltstart eines 6.0.8-Debian-Servers (HP ProLiant) kam ntpd
es zu Problemen mit der Systemzeit: Offset und Jitter im Vergleich zu den üblichen und zuverlässigen Referenzzeitservern, die unbegrenzt wachsen. (Beachten Sie, dass ein identischer Zwillingsserver überhaupt kein Problem hatte.) Nach vielen erfolglosen Versuchen, das Problem auf der ntpd
Seite zu beheben, entschied ich mich für einen Neustart, und alles ging in Ordnung.
Um das Problem zu untersuchen, habe ich diese Diskrepanz gefunden, die meine Uhrprobleme erklären könnte:
root@n1:~# zgrep Detected /var/log/dmesg*
/var/log/dmesg:[ 0.004000] Detected 2400.110 MHz processor.
/var/log/dmesg.0:[ 0.004000] Detected 2383.579 MHz processor.
/var/log/dmesg.1.gz:[ 0.004000] Detected 2400.036 MHz processor.
/var/log/dmesg.2.gz:[ 0.004000] Detected 2400.298 MHz processor.
/var/log/dmesg.3.gz:[ 0.004000] Detected 2400.165 MHz processor.
/var/log/dmesg.4.gz:[ 0.004000] Detected 2400.410 MHz processor.
Beachten Sie, dass beim vorletzten Start (dem problematischen) die erkannte CPU-Frequenz ein deutlicher Ausreißer ist. Ohne den Ausreißer beträgt der Fehler und die Standardabweichung der erfassten Frequenz in Bezug auf die nominelle Frequenz +0,15 MHz ± 0,25 MHz. Für das problematische Booten habe ich einen Fehler von -16,4 Mhz, der ca. 100 mal größer ist als erwartet.
Meine Fragen:
Kann ein Fehler dieser Art die
ntp
Zeitdisziplin instabil / unbrauchbar machen? Ist das der Grund für meine Uhrprobleme?Ist diese Art von Verhalten ein Symptom für fehlerhafte Hardware? Sollte der Server in die Hardware-Wartung gehen?
Aktualisieren
Einige nützliche Daten:
- Kernel ist 2.6.32-5-amd64 (Debian 2.6.32-48squeeze4)
current_clocksource
isttsc
- Fehler für
lpj
ist (natürlich) konsistent mit Fehler auf der CPU-Frequenz
Einige Kontextzeilen für die oben genannten grep
[ 0.000000] hpet clockevent registered
[ 0.000000] Fast TSC calibration using PIT
[ 0.004000] Detected 2400.110 MHz processor.
[ 0.000008] Calibrating delay loop (skipped), value calculated using timer frequency.. 4800.22 BogoMIPS (lpj=9600440)
ntpdc -c loopinfo
gab mir nie einen Frequenzdriftwert. Jetzt nach dem Neustart scheint alles in Ordnung zu sein, mit einem stabilen Driftwert ... Übrigens, Ihr Vorschlag ist richtig, ich überprüfelog/loopstats
auf abnormales Verhalten.