Ich habe 15 identische 64-Bit-Server für Linux RH 4.7. Sie führen eine Clusterdatenbank aus (Cluster ist Anwendungsebene). Gelegentlich (jeden Monat oder so) friert eine zufällige Box (allerdings nie dieselbe) ein.
Ich kann die Box pingen und Ping funktioniert. Wenn ich versuche, in der Box zu ssh, bekomme ich:
ssh_exchange_identification: Connection closed by remote host
SSH ist ordnungsgemäß eingerichtet.
Wenn ich in den Serverraum gehe und versuche, mich direkt bei der Konsole anzumelden, kann ich die Konsole mit Alt+ wechseln Fn, einen Benutzernamen eingeben und Zeichen werden angezeigt, aber nach dem Drücken Enterpassiert nichts. Ich habe einmal 8 Stunden gewartet und es hat sich nicht geändert.
Ich habe syslog eingerichtet, um alles auf einem Remote-Host zu protokollieren, und diese Protokolle enthalten nichts. Wenn ich den Computer neu starte, funktioniert es ohne Probleme. Ich habe HW-Tests durchgeführt - alles ist in Ordnung und nichts ist in den Protokollen. Die Maschinen werden auch mit NAGIOS überwacht, und es gibt keine ungewöhnliche Belastung oder Aktivität vor dem Einfrieren.
Ich habe keine Ideen mehr; Was kann ich noch tun oder überprüfen?