Fehlerbehebungsstrategie für sehr schlechte iSCSI / NFS-Leistung


9

Wir haben eine neue Synology RS3412RPxs, die iSCSI-Ziele für drei Windows 2008 R2-Boxen und NFS für eine OpenBSD 5.0-Box bietet.

Wenn Sie sich mit ssh beim RS3412 anmelden und sowohl kleine Dateien als auch 6-GB-Dateien mit dd und verschiedenen Blockgrößen lesen / schreiben, zeigen Sie eine hervorragende Festplatten-E / A-Leistung.

Mit dd oder iometer auf den iSCSI / NFS-Clients erreichen wir bis zu 20 Mbit / s (das ist kein Tippfehler. Zwanzig Mbit / s). Wir hatten gehofft, die mehreren Gbit-NICs in der Synology besser nutzen zu können.

Ich habe überprüft, ob die Switch- und NIC-Port-Konfiguration auf Gigabit eingestellt ist und nicht automatisch ausgehandelt wird. Wir haben es mit und ohne Jumboframes ohne Unterschied versucht. Ich habe mit Ping überprüft, dass die MTU derzeit 9000 ist. Zwei Firmware-Upgrades wurden bereitgestellt.

Ich werde versuchen, eine direkte Verbindung zwischen dem iSCSI-Ziel und dem Initiator herzustellen, um Switch-Probleme auszuschließen. Aber was sind meine anderen Optionen?

Wonach suche ich, wenn ich wireshark / tcpdump ausbreche?


Ist die Flusskontrolle aktiviert? Welche Art von Schalter liegt dazwischen?
SpacemanSpiff

@SpacemanSpiff: Die Flusskontrolle ist nicht aktiviert. Würden Sie erwarten, dass das einen Unterschied macht? Es ist ein ZyXEL GS2200.
Alex Holst

Eine Art schwächere Rückwandplatine, aber genug, um eine bessere Leistung zu erzielen. Neugierig zu sehen, was das Crossover-Kabel Ihnen in Bezug auf die Leistung bringt.
SpacemanSpiff

Antworten:


4

Schauen Sie sich die Einstellungen für die Flusskontrolle an den Schaltern noch einmal an, da dies hier das häufig verwendete Thema zu sein scheint. Wenn die Switches über Ethernet-Zählerstatistiken verfügen, überprüfen Sie diese und prüfen Sie, ob eine große Anzahl von Ethernet-PAUSE-Frames vorhanden ist. Wenn ja, ist das wahrscheinlich Ihr Problem. Im Allgemeinen wird dieses Problem durch Deaktivieren von QOS auf den Switches behoben.


Ich warf einen weiteren Blick darauf. Die Flusskontrolle war deaktiviert und die PAUSE-Zähler waren an allen Schnittstellen Null. Durch Aktivieren der Flusskontrolle werden PAUSE-Zähler um 25% der Paketanzahl erhöht. Wir haben einige Hardware identifiziert, die nicht die gleiche schwache Leistung aufweist. Daher möchten wir jetzt die netten Treiber aktualisieren und bestimmte Nics durch leistungsfähigere ersetzen. QoS war auf dem Switch bereits deaktiviert. Danke für deinen Beitrag.
Alex Holst


3

Solche Flows deuten darauf hin, dass die verschiedenen TCP-Flow-Control-Methoden nicht richtig funktionieren. Ich habe einige Probleme mit Linux-Kerneln gesehen, die mit Windows-Versionen nach Vista sprechen, und Sie erhalten solche Durchsätze. Sie tauchen in Wireshark ziemlich gut auf, wenn Sie einen Blick darauf werfen.

Die absolut schlimmste Möglichkeit ist, dass die TCP-verzögerte Bestätigung vollständig unterbrochen ist und Sie ein Verkehrsmuster sehen, das wie folgt aussieht:

packet
packet
[ack]
packet
packet
[ack]

Ich habe dieses Problem gelöst, indem ich NIC-Treiber-Updates auf die Windows-Server angewendet habe. Die intelligenten Netzwerkkarten, die mit einigen (Broadcom-) Servern geliefert werden, können manchmal auf interessante Weise ausfallen, und dies ist eine.

Ein normales Verkehrsmuster wäre eine große Anzahl von Paketen, gefolgt von einem Ack-Paket.

Das andere, wonach man suchen muss, sind lange Verzögerungen. Verdächtige Werte sind 0,2 Sekunden und 1,0 Sekunden. Dies deutet darauf hin, dass eine Seite nicht das bekommt, was sie erwartet, und darauf wartet, dass eine Zeitüberschreitung abläuft, bevor sie antwortet. Kombinieren Sie das oben genannte fehlerhafte Paketmuster mit einer Verzögerung von 200 ms für die ACK und Sie erhalten Durchsätze von satten 1 MB / s.

Das sind die leicht zu erkennenden schlechten Verkehrsmuster.

Ich habe nicht mit dieser Art von NAS-Gerät gearbeitet, weiß also nicht, wie optimierbar es ist, das zu reparieren, was gefunden wird.


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.