Es besteht eine geringe Wahrscheinlichkeit eines vollständigen Gehäuseausfalls ...
Sie werden wahrscheinlich auf Probleme in Ihrer Einrichtung stoßen, bevor ein vollständiger Ausfall eines Blade-Gehäuses auftritt.
Ich habe hauptsächlich Erfahrung mit HP C7000- und HP C3000- Blade-Gehäusen. Ich habe auch Dell- und Supermicro-Blade-Lösungen verwaltet. Hersteller ist ein bisschen wichtig. Aber zusammenfassend ist festzuhalten, dass die HP-Ausrüstung hervorragend ist, dass Dell in Ordnung ist und dass es Supermicro an Qualität, Belastbarkeit und schlechtem Design mangelt. Ich habe auf Seiten von HP und Dell noch nie Ausfälle erlebt. Das Supermicro hatte ernsthafte Ausfälle und zwang uns, die Plattform zu verlassen. Bei den HPs und Dells ist noch nie ein vollständiger Gehäuseausfall aufgetreten.
- Ich habe thermische Ereignisse gehabt. Die Klimatisierung schlug in einer Co-Location-Einrichtung fehl und es wurden 10 Stunden lang Temperaturen von bis zu 46 ° C erreicht.
- Spannungsspitzen und Leitungsausfälle: Eine Seite einer A / B-Einspeisung wird unterbrochen. Einzelne Stromversorgungsfehler. In meinen Blade-Konfigurationen befinden sich normalerweise sechs Netzteile, sodass ausreichend Warnung und Redundanz vorhanden sind.
- Ausfälle einzelner Blade-Server. Die Probleme eines Servers wirken sich nicht auf die anderen Server im Gehäuse aus.
- Ein Feuer im Fahrgestell ...
Ich habe eine Vielzahl von Umgebungen gesehen und hatte den Vorteil, dass ich unter idealen Bedingungen für Rechenzentren und an raueren Standorten installiert habe. Auf der HP C7000- und C3000-Seite ist vor allem zu berücksichtigen, dass das Gehäuse vollständig modular aufgebaut ist. Die Komponenten sind so konzipiert, dass die Auswirkungen eines Komponentenausfalls auf die gesamte Einheit minimiert werden.
Stellen Sie sich das so vor ... Das Hauptgehäuse des C7000 besteht aus Front-, (passiven) Midplane- und Backplane-Baugruppen. Das strukturelle Gehäuse hält einfach die vorderen und hinteren Komponenten zusammen und trägt das Gewicht des Systems. Fast jedes Teil kann ersetzt werden ... glauben Sie mir, ich habe viele zerlegt. Die wichtigsten Redundanzen liegen in den Bereichen Lüfter / Kühlung, Stromversorgung und Vernetzung sowie im Management. Die Verwaltungsprozessoren ( HP Onboard Administrator ) können aus Redundanzgründen gekoppelt werden, die Server können jedoch auch ohne sie ausgeführt werden.
Voll bestücktes Gehäuse - Vorderansicht. Die sechs Stromversorgungen an der Unterseite erstrecken sich über die gesamte Tiefe des Gehäuses und werden an eine modulare Strom-Rückwandplatinenbaugruppe an der Rückseite des Gehäuses angeschlossen. Die Stromversorgungsmodi sind konfigurierbar: zB 3 + 3 oder n + 1. Das Gehäuse hat also definitiv eine redundante Stromversorgung.
Voll bestücktes Gehäuse - Rückansicht. Die Virtual Connect-Netzwerkmodule auf der Rückseite verfügen über eine interne Querverbindung, sodass ich die eine oder andere Seite verlieren und trotzdem die Netzwerkverbindung zu den Servern aufrechterhalten kann. Es gibt sechs Hot-Swap-fähige Netzteile und zehn Hot-Swap-fähige Lüfter.
Leergehäuse - Vorderansicht. Beachten Sie, dass an diesem Teil des Gehäuses wirklich nichts ist. Alle Verbindungen werden zur modularen Mittelplatine durchgeleitet.
Mittelplatinenbaugruppe entfernt. Beachten Sie die sechs Stromzuführungen für die Midplane-Baugruppe unten.
Midplane-Baugruppe. Hier geschieht die Magie. Beachten Sie die 16 separaten Downplane-Verbindungen: eine für jeden Blade-Server. Ich habe einzelne Server-Sockel / -Schächte ausfallen lassen, ohne das gesamte Gehäuse zu zerstören oder die anderen Server zu beeinträchtigen.
Netzteil-Backplane (s). 3ø Einheit unter Standard-Einphasenmodul. Ich habe die Stromverteilung in meinem Rechenzentrum geändert und einfach die Netzteil-Backplane ausgetauscht, um mich mit der neuen Methode der Stromlieferung zu befassen
Beschädigung des Gehäusesteckers. Dieses spezielle Gehäuse wurde während der Montage fallen gelassen und brach die Stifte eines Flachbandverbinders ab. Dies blieb tagelang unbemerkt, was dazu führte, dass sich das Laufschaufel-Chassis mit FIRE ...
Hier sind die verkohlten Überreste des Midplane-Flachbandkabels. Dadurch wurde ein Teil der Gehäusetemperatur- und Umgebungsüberwachung gesteuert. Die internen Blade-Server liefen ohne Zwischenfälle weiter. Die betroffenen Teile wurden während der geplanten Ausfallzeit nach Belieben ausgetauscht, und alles war in Ordnung.