Heute hatten wir eine Reihe von Maschinen, die keinen Internetzugang mehr hatten. Nach vielen Fehlern ist der rote Faden, dass alle ihren DHCP-Mietvertrag heute erneuert haben (wir haben hier 8-Tage-Mietverträge).
Alles, was Sie erwarten würden, sieht nach der Verlängerung des Mietvertrags gut aus: Sie haben eine gültige IP-Adresse, einen DNS-Server und ein Gateway. Sie haben Zugriff auf interne Ressourcen (Dateifreigaben, Intranet, Drucker usw.). Ein wenig mehr Fehlerbehebung zeigt, dass sie nicht in der Lage sind, einen Ping- oder Tracert-Vorgang zu unserem Gateway durchzuführen, aber sie können zu unserem Core-Layer3-Switch direkt vor dem Gateway gelangen. Das Zuweisen einer statischen IP zum Computer funktioniert als temporäre Lösung.
Eine letzte Falte ist, dass bisher nur Berichte für Kunden auf demselben VLAN wie das Gateway eingegangen sind. Unser Verwaltungspersonal und unsere Fakultät befinden sich auf demselben VLAN wie die Server und Drucker, aber Telefone, Schlüsselanhänger / Kameras, Studenten / WLAN und Labore haben jeweils ihre eigenen Vlans, und soweit ich auf keinem der anderen Vlans etwas gesehen habe hat schon ein Problem gehabt.
Ich habe ein separates Ticket beim Gateway-Anbieter, aber ich vermute, dass sie das Problem lösen und mir mitteilen, dass das Problem an einer anderen Stelle im Netzwerk liegt. Deshalb frage ich auch hier. Ich habe Arp-Caches auf dem Gateway und dem Core-Switch gelöscht. Irgendwelche Ideen sind willkommen.
Update:
Ich habe versucht, vom Gateway zurück zu einigen betroffenen Hosts zu pingen, und das Seltsame ist, dass ich eine Antwort erhalten habe: von einer völlig anderen IP-Adresse. Ich habe ein paar mehr zufällig ausprobiert und schließlich folgendes bekommen:
Fri Sep 02 2011 13:08:51 GMT-0500 (Zentrale Sommerzeit) PING 10.1.1.97 (10.1.1.97) 56 (84) Datenbytes. 64 Bytes vom 10.1.1.105: icmp_seq = 1 ttl = 255 time = 1,35 ms 64 Bytes vom 10.1.1.97: icmp_seq = 1 ttl = 255 Zeit = 39,9 ms (DUP!)
10.1.1.97 ist das tatsächlich beabsichtigte Ziel des Pings. 10.1.1.105 soll ein Drucker in einem anderen Gebäude sein. Ich habe noch nie zuvor ein DUP in einer Ping-Antwort gesehen.
Meine derzeit beste Vermutung ist ein betrügerischer WLAN-Router in einem unserer Schlafsäle im Subnetz 10.1.1.0/24 mit einem schlechten Gateway.
... fuhr fort. Ich habe jetzt den fehlerhaften Drucker ausgeschaltet und Pings an einen betroffenen Host vom Gateway aus schlagen einfach vollständig fehl.
Update 2:
Ich überprüfe Arp-Tabellen auf einem betroffenen Computer, dem Gateway und jedem Wechsel zwischen ihnen. Zu jedem Zeitpunkt waren die Einträge für diese Geräte alle korrekt. Ich habe nicht jeden Eintrag in der Tabelle überprüft, aber jeder Eintrag, der möglicherweise den Datenverkehr zwischen dem Host und dem Gateway beeinträchtigen könnte, war in Ordnung. ARP ist nicht das Problem.
Update 3: Die
Dinge funktionieren im Moment, aber ich kann nichts sehen, was ich getan habe, um sie zu beheben, und daher habe ich keine Ahnung, ob dies nur eine vorübergehende Pause sein könnte. Wie auch immer, ich kann jetzt nicht viel tun, um zu diagnostizieren oder Fehler zu beheben, aber ich werde mehr aktualisieren, wenn es wieder kaputt geht.