Wir bereiten uns auf ein umfangreiches Upgrade unserer SQL Server vor und stellen ein ungewöhnliches Verhalten bei verteilten Verfügbarkeitsgruppen fest, das ich auflösen möchte, bevor ich fortfahre.
Letzten Monat habe ich einen Remote-Sekundärserver von SQL Server 2016 auf SQL Server 2017 aktualisiert. Dieser Server ist Teil mehrerer Distributed Availability Groups (DAGs) und einer separaten Availability Group (AG) . Als wir diesen Server aufgerüstet haben, war uns nicht bewusst, dass er in einen unlesbaren Zustand übergehen würde. Daher haben wir uns im letzten Monat ausschließlich auf den Primärserver verlassen.
Als Teil des bevorstehenden Upgrades habe ich den CU 4- Patch auf den Server angewendet und neu gestartet. Als der Server wieder online ging, zeigte der gerade gepatchte sekundäre Server, dass alle DAGs / AGs ohne Probleme synchronisiert wurden.
Die primäre zeigte jedoch eine ganz andere Geschichte. Es wurde berichtet, dass
- Die separate AG wurde ohne Probleme synchronisiert
- Die DAGs befanden sich jedoch in einem nicht synchronisierenden / nicht fehlerfreien Zustand
Nachdem ich anfänglich in Panik geraten war, habe ich versucht, die folgenden Dinge in den DAGs wieder zu synchronisieren:
- Von der Grundschule aus habe ich angehalten und die Datenbewegung fortgesetzt. Die Daten wurden nicht synchronisiert.
- Auf der sekundären (die ich gerade gepatcht habe) lief ich
ALTER DATABASE [<database] SET HADR RESUME;
- die ohne Fehler ausgeführt, aber keine Synchronisation wieder aufgenommen
Mein letzter Versuch, die Daten erneut zu synchronisieren, bestand darin, mich beim sekundären Server anzumelden und den SQL Server-Dienst manuell neu zu starten. Ein manueller Neustart des Dienstes scheint etwas extrem zu sein, da zu erwarten wäre, dass der neu gestartete Server ausreichen würde.
Ist jemand auf dieses Problem gestoßen, bei dem eine DAG nach einem Neustart nicht mit einer sekundären Synchronisierung beginnt? Wenn ja, wie wurde es gelöst?
Ich habe sowohl das SQL Server-Fehlerprotokoll als auch die Ereignisanzeige auf dem sekundären Server überprüft. Es gab nichts Außergewöhnliches, das ich sehen konnte.