Wir haben eine EMC NX4 SAN-Box, die eine CIFS-Freigabe für eine Reihe von Windows Server 2008 R2-App-Servern bereitstellt. Die App-Server verwenden die CIFS-Freigabe, um viele Bilddateien bereitzustellen (~ 2500 Ops / Sek. Auf der Freigabe). Weder das SAN noch die App-Server weisen jedoch offensichtliche Anzeichen von Stress auf.
Hin und wieder wird ein App-Server anscheinend plötzlich die Verbindung zum SAN trennen. Jeder .NET-Code, der versucht, eine Datei aus dem SAN bereitzustellen, schlägt fehl mit:
System.IO.IOException: The specified network name is no longer available
Wenn ich RDP zum App-Server verwende und versuche, über den Explorer auf "\ san-name" zuzugreifen, wird der gleiche Fehler angezeigt. Alle anderen App-Server können problemlos darauf zugreifen. Ich kann auch perfekt auf "\ ip-of-san" zugreifen, Ping funktioniert auch.
Ein Neustart des App-Servers behebt das Problem, aber das ist eine etwas drastische Maßnahme für das Problem, da das SAN anscheinend einwandfrei funktioniert und der Computer darauf zugreifen kann - es sieht nur so aus, als hätte der Zugriff "\ san-name" barfed up.
Dies ist in der letzten Woche zwei verschiedenen App-Servern passiert, daher vermute ich nicht, dass ein einzelner App-Server die Ursache ist. Die Ursache vorerst ignorieren - wie würde ich die Verbindung "\ san-name" wiederherstellen, ohne den Computer neu zu starten? Und kann ich irgendwie abfragen, was schief gelaufen ist?
Ereignisprotokolle zeigen nichts (außer verwandten ASP.NET-Fehlern, die durch das Problem verursacht wurden), weder auf App-Servern noch im SAN.
Update:
Basierend auf den Vorschlägen werde ich beim nächsten Mal einen Neustart des Workstation-Dienstes versuchen und prüfen, ob dies das Problem behebt. Auf jeden Fall kein Fix, aber viel schneller als den gesamten Computer neu zu starten, wie ich es derzeit getan habe. Gibt es eine Möglichkeit, den Status der Verbindungen abzufragen, die der Workstation-Dienst verwaltet?
Update 2: Es wurde
bestätigt, dass durch einen Neustart des Workstation-Dienstes das Problem "behoben" wird. Der nächste Schritt besteht darin, die Reg-Änderung zu versuchen, um den MaxCmds-Wert zu erhöhen. Kann nicht bestätigen, ob es sich um das Problem handelt, kann nur annehmen, wenn es über einen längeren Zeitraum ohne Probleme ausgeführt wird.