Ich habe eine E-Mail von einem Benutzer erhalten, der besorgt ist, dass die folgenden Fehler auf einem seiner Server auf ein ernstes Problem hinweisen. Das Problem ist, dass die folgenden Fehler alles sind , was ich tun muss. Normalerweise betrachte ich mich als anständigen Googler, aber in diesem Fall kann ich nur einen anderen Vorfall finden, bei dem die Benutzer auf diesen Fehler bezüglich "Probe Filter Directory" gestoßen sind:
[1044 snapshots @ abc]$
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: CPU:0
MC4_STATUS[Over|CE|MiscV|-|AddrV|-|Poison|CECC]: 0xdc0248d0001f010b
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: MC4_ADDR: 0x0000000000010f40
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: Northbridge Error (node 0): ECC Error in the
Probe Filter directory.
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: cache level: L3/GEN, tx: GEN, mem-tx: GEN
Soweit ich das beurteilen kann, ist dies nur einmal passiert. Wenn Sie in den Protokollen nach anderen Hardwarefehlern suchen, wird nichts anderes als dieser eine Vorfall angezeigt.
Der Forumsbeitrag, auf den ich oben verweise, endet einfach damit, dass der Benutzer sich keine Sorgen machen soll, wenn er nur einmal vorkommt und keine schwerwiegenden Probleme verursacht. Dies ist der gleiche Rat, den ich von meinen Kollegen erhalten habe, die auch erwähnt haben, dass es zu viele Variablen gibt (dh was lief am 8. September um 2:50 Uhr morgens?).
Dieser Benutzer möchte jedoch sicher sein, dass etwas mit seinem System nicht stimmt. Was können die oben genannten Fehler anzeigen oder damit zusammenhängen? Was ist das "Probe Filter-Verzeichnis"? Welche Tests kann ich ausführen, um den Benutzer zu beruhigen, dass dies seinen Computer nicht für das bevorstehende Schicksal kennzeichnet?
Die Linux-Distribution des Computers ist Red Hat Enterprise Linux Server Version 6.4 (Santiago).