Dies ist meine Grundeinstellung:
- Ich verwende einen Server (DL380 G7; Linux 3.13-Kernel), auf dem ~ 10 virtuelle Maschinen gehostet werden
- Es ist auf automatisches Einschalten eingestellt
- Ich benutze NUT für die USV-Verwaltung
- Die ordnungsgemäße Abschaltdauer des Hosts (einschließlich des ersten Herunterfahrens des VMS) beträgt ~ 8-10 Minuten
- Die Gesamtlaufzeit der USV (ich habe 2, die jeweils ein Netzteil im Server und ein Netzteil im angeschlossenen Speicher mit Strom versorgen) bei voll aufgeladenen Batterien beträgt ~ 75 Minuten.
- Ich habe die Pegel von UPS / NUT so eingestellt, dass ich den kritischen Pegel (LOWBATT) habe, dh nach 15 Minuten das Herunterfahren einleiten (ich wage es nicht, tiefer zu gehen).
Das folgende Szenario ist mir in den letzten 12 Monaten bisher zweimal passiert:
- Stromausfall, USV übernehmen ganz gut
- Die Stromversorgung bleibt ca. 1 Stunde lang ausgeschaltet -> das Herunterfahren wird wie vorgesehen eingeleitet
- Der Server stoppt die vms und beginnt mit dem Herunterfahren
- -> Irgendwann kommt hier wieder Strom
- Der Server wird heruntergefahren und ausgeschaltet
- Der Server wird nicht wieder online geschaltet, da die USV (wieder) mit Strom versorgt wird und der Server tatsächlich nie Strom verloren hat (von der USV geliefert wird). Im Grunde sieht es für den Server so aus, als wäre es ein absichtliches, ordnungsgemäßes Herunterfahren gewesen.
- Sobald ich merke, dass ich den Server über ILO aus der Ferne einschalte [das letzte Mal geschah dies heute um 03:46 Uhr :-), deshalb frage ich]
Wie ewwhite betont hat, wären die spezifischen USV-Modelle hilfreich:
- Eaton 5PX 2200VA mit +1 EBM
- Roline Prosecure II, 1500 VA RM2U, mit +1 EBM
Hat jemand von euch das gleiche Problem? Gibt es eine Out-of-the-Box-Lösung für einige USVs?
Bisher habe ich überlegt, ein Linux-Gerät mit geringem Stromverbrauch (Raspberry Pi?) Einzustellen, um die Überwachung zu übernehmen. Es würde die Ups-Einheiten auf ausreichende Ladung der Batterien und den Eingangsleistungsstatus prüfen und dann den Server über ILO / IPMI neu starten.
Ist eine automatische Lösung einfach zu störend (für meinen Fall und allgemein) und sollte ich einfach manuell eingreifen, wann und ob dies passiert?
Grüße
Martin