Meine Xen-Server sind openSUSE 11.1 mit open-iscsi für unseren iSCSI-SAN-Cluster. Die SAN-Module befinden sich in einer IP-Failover-Gruppe hinter einer virtuellen IP, mit der die Initiatoren eine Verbindung herstellen.
Für den Fall, dass der primäre SAN-Server ausfällt, übernimmt der sekundäre Server die Rolle des Ziels. Dies alles wird von der LeftHand SAN / iQ-Software erledigt und funktioniert in den meisten Situationen gut.
Das Problem, das ich habe, ist, dass gelegentlich bei einigen meiner Xen-DomUs das Root-Dateisystem nach einem IP-Failover schreibgeschützt ist. Es ist nicht konsistent und passiert bei jedem Failover mit einer anderen Teilmenge. Sie führen alle dasselbe openSUSE 11.1-Software-Image aus.
Die Root-Dateisysteme für jede DomU werden von open-iscsi in Dom0 bereitgestellt, und Xen verwendet den Standard-Blockgerätetreiber, um sie für die DomU verfügbar zu machen.
Das genaue Symptom ist, dass als Root beim Ausführen touch /test
der Fehler "Nur-Lese-Dateisystem" zurückgegeben wird. Die Ausgabe von mount
zeigt es jedoch als gemountet mit Lese- / Schreibzugriff an. Natürlich fallen zu diesem Zeitpunkt auch alle anderen E / A auf der domU aus, sodass die Maschine schwer ausfällt. xm
Wenn Sie es einfach von Dom0 aus neu starten, ohne die iSCSI-Sitzung erneut zu verbinden, funktioniert alles wieder.
Auf der Dom0-Seite sind die Syslog-Nachrichten während des Failovers ungefähr wie folgt:
kernel: connection1:0: iscsi: detected conn error (1011)
iscsid: Kernel reported iSCSI connection 1:0 error (1011) state (3)
iscsid: connection1:0 is operational after recovery (1 attempts)
Es fällt mir schwer herauszufinden, auf welcher Ebene dieses Problem behoben werden kann. Ist es etwas im DomU-Kernel? oder auf Dom0- oder Xen-Ebene? Ich denke, es gibt wahrscheinlich irgendwo einen Parameter, der angepasst werden muss, um eine Zeitüberschreitung zu erhöhen, aber ich bin mir nicht sicher, wo ich suchen soll.
Ich denke nicht wirklich, dass es ein Problem mit open-iscsi ist, nur weil das angeschlossene Blockgerät immer noch vom Dom0 aus lesbar und beschreibbar ist.