Die Kombination von ECMP (oder anderen Ursachen für asymmetrische Pfade) und HSRP ist in Cisco IOS standardmäßig fehlerhaft. Das Standardverhalten mit diesem Entwurf überflutet den Unicast-Verkehr übermäßig.
Was ist die beste Vorgehensweise für die Verwendung von HSRP mit ECMP, um unbekannte Unicast-Überflutungen zu verhindern?
Details / Hintergrund
Wir haben für viele unserer Einrichtungen eine HSRP-Topologie, die dem ersten Diagramm unten ähnelt. Unsere Cisco WAN-Router bieten kostengünstige Routen zu allen anderen Standorten. Auf diese Weise können wir ständig asymmetrische Routing-Effekte feststellen. Normalerweise weisen wir R1 als HSRP-Primärdaten zu, aber ECMP lässt den Rückdatenverkehr entweder über R1 oder R2 zu.
Das Problem ist, dass wenn PC1 ein Remote-iSCSI-Laufwerk über das WAN bereitstellt, der Datenverkehr den Standort über R1 verlässt, aber über R2 zurückkehren kann. Solange der iSCSI-Verkehr über R1 zurückkehrt, gibt es keine Probleme.
Das Problem tritt auf, wenn der Datenverkehr von PC1 über R2 zurückkehrt. Angenommen, die iSCSI-Sitzung beginnt um 8:00:00 Uhr und beide Router und beide Switches lernen gleichzeitig den Mac von PC1. Zwischen 8:00:00 und 8:00:05 gibt es keine Überschwemmungsprobleme, da beide Switches immer noch die MAC-Adresse von PC1 in ihrer CAM-Tabelle haben.
Fünf Minuten nach dem Start der iSCSI-Sitzung läuft der CAM-Eintrag von S2 für den Mac von PC1 aus der CAM-Tabelle aus und S2 überflutet den Datenverkehr von PC1 über alle Ports (in diesem Fall zu Po1, Gi0 / 3 und Gi0 / 4). Wenn die iSCSI-Sitzung von PC1 viel Bandbreite beansprucht, kann dieses unbekannte Unicast-Flooding nicht-triviale Kapazität von den Verbindungen zu PC3 und PC4 beanspruchen.
Cisco IOS-Switches haben einen Standard-CAM-Timer von 300 Sekunden ...
S2# show mac address-table aging-time
Vlan Aging Time
---- ----------
1 300
17 300
Der Standard-ARP-Timer der Cisco IOS-Benutzeroberfläche beträgt jedoch 4 Stunden.
R2# show interface gi0/0
GigabitEthernet0/0 is up, line protocol is up
Hardware is AmdP2, address is 000a.dead.beef (bia 000a.dead.beef)
Internet address is 172.17.1.252/24
MTU 1500 bytes, BW 10000 Kbit, DLY 1000 usec,
reliability 255/255, txload 1/255, rxload 1/255
Encapsulation ARPA, loopback not set
Keepalive set (10 sec)
ARP type: ARPA, ARP Timeout 04:00:00 <--------------
Daher beginnt S2 nach fünf Minuten, den iSCSI-Verkehr von PC1 zu überfluten.