Ist es für einen Server, der Ausfallzeiten toleriert, besser, einen Ersatz für ein heißes oder ein kaltes Ersatzteil zu verwenden?


7

Mit anderen Worten, sollte ich eine Ersatzdiskette im Regal lassen oder als Ersatzlaufwerk einrichten?

Wenn der Server ein wenig ausfällt, ist dies nicht das Ende der Welt. Es ist kein Webserver oder irgendetwas, das rund um die Uhr verfügbar sein muss. Gibt es Nachteile (Lebensdauer / Verschleiß des Laufwerks usw.), wenn die zusätzliche Festplatte als Ersatzlaufwerk eingerichtet bleibt, oder ist es besser, sie irgendwo in einem Regal zu lassen, wenn ich nicht die sofortige Wiederherstellungszeit eines Hotspares benötige?


Sprechen Sie über ein Ersatzteil für den Server selbst oder ein Ersatzteil für ein Array innerhalb des Servers? So wie ich diese Frage gelesen habe, klingt es so, als würden Sie nach einem vollständigen Hot / Cold-Standby-Backup-Server fragen, aber andere haben sie beantwortet, als würden Sie über ein RAID-Array sprechen.
Tim

Antworten:


6

Sie können ein Cold Spare nicht auf Funktionalität testen. Nach allem, was Sie wissen, funktioniert dieses Laufwerk im Regal nicht. Verwenden Sie es als Ersatzlaufwerk, es sei denn, Ihr Gehäuse ist voll ausgelastet.

Dies bedeutet auch, dass Sie wieder zur vollständigen Redundanz im Array zurückkehren, ohne dass Sie darauf zugreifen müssen. nützlich für Ferienwochenenden usw.


3
Einverstanden. Darüber hinaus drehen gute RAID-Controller der Enterprise-Klasse Ersatzlaufwerke herunter, um den Verschleiß der Lager usw. zu verringern, und drehen die Laufwerke regelmäßig (wöchentlich) hoch, um zu überprüfen, ob sie noch funktionieren. Für die Hot-Standby-Laufwerke erhalten wir sowohl reduzierten Laufwerksverschleiß als auch regelmäßige Spinup-Tests.
Jesper M

2

Wenn Sie "ein bisschen Ausfallzeit" sagen, bedeutet dies, dass Sie es sich leisten können, den Server neu zu erstellen oder von der Sicherung wiederherzustellen, wenn Sie das RAID-Array selbst verlieren, dem das Ersatzlaufwerk zugewiesen wird, wenn mehrere Laufwerke ausfallen?

Unterliegt der Server und die Laufwerke einer Ersatzgarantie? Welche Art? (24x7x4 oder 9x5xNBD oder was?)

Ich würde es basierend auf den folgenden wählen:

  • Sie können aus dem Backup wiederherstellen ODER sind bereit, das Risiko mehrerer Laufwerksausfälle zu übernehmen UND Sie haben eine angemessene Hardware-Garantie aktiv = KEIN Ersatzlaufwerk und KEIN Ersatzlaufwerk (ersetzen Sie einfach das fehlerhafte Laufwerk durch den Garantieservice).
  • COLD Spare = Ich würde diese Option verwenden, wenn Sie mehrere Server mit demselben Laufwerkstyp haben und Geld sparen möchten, indem Sie nur ein einziges Cold Spare-Laufwerk im Regal haben, falls einer dieser Server eine schlechte Festplatte hat.
  • HOT spare = Ich würde diese Option verwenden, wenn der Server kritisch ist und Sie es sich nicht leisten können, eine Wiederherstellung aus dem Backup durchzuführen, oder wenn Sie nicht möchten, dass das mit mehreren Laufwerksausfällen verbundene Risiko besteht, oder wenn Sie nicht fleißig sind oder angemessene Benachrichtigungen erhalten, um dies zu wissen Ein Laufwerk ist defekt (nichts Schlimmeres als ein Laufwerk, das am Montag defekt ist, und Sie wissen 2 Wochen lang nichts davon, wenn Sie sich entscheiden, wieder in das Rechenzentrum zurückzukehren).

1

Hotspare birgt seine eigenen Gefahren, da es zu einem automatischen Wiederaufbau führt.

Aufgrund der Größe der Arrays in den TBs und der Menge veralteter Daten besteht eine numerische Wahrscheinlichkeit, dass das Array während der automatischen Neuerstellung einen weiteren Fehler findet. Dies wird durch die lange Dauer von Umbauten noch verstärkt. 20 Stunden wieder aufbauen? Es dauert lange zu warten, bis Sie das Richtige tun können.

Daher ist es besser, keine automatische Neuerstellung durchzuführen. Im Falle eines Laufwerksfehlers möchten Sie die Sicherung und die Failover-Mechanismen überprüfen, bevor Sie die Neuerstellung starten.

Um die Wahrscheinlichkeit eines Ausfalls aufgrund eines Laufwerksfehlers in der Zeit vor der Wiederherstellung zu verringern, benötigen Sie ein Array, das zwei Laufwerksfehler behandeln kann: Raid 6 oder Raid 10.


1

Überlegen Sie, ob die Kosten für beide gerechtfertigt sind. Wenn ein heißes Ersatzteil zum Umschneiden bereit ist, wird eine schnelle Wiederherstellung sichergestellt, und wenn darüber ein kaltes Ersatzteil bereitsteht, kann eine schnelle Rückkehr zur Redundanz sichergestellt werden.


0

Wenn Sie die Wahl haben, warum sollten Sie sich nicht für ein heißes Ersatzteil entscheiden? Nur einer der Vorteile: Es erleichtert Ihnen die Arbeit, wenn es erforderlich ist.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.