Wenn Sie die Zeit haben, lesen Sie Pinheiro et al. (2007) Fehlertrends bei einer großen Festplattenpopulation. Tagungsband der 5. USENIX-Konferenz zu Datei- und Speichertechnologien, Februar 2007 . Es kann von http://static.googleusercontent.com/external_content/untrusted_dlcp/labs.google.com/en//papers/disk_failures.pdf abgerufen werden
Im Allgemeinen entsprechen Laufwerke desselben Herstellers hinsichtlich der Plattenbaugruppe denselben Spezifikationen. Normalerweise unterscheiden sich die Toleranzen. Wenn Sie beispielsweise einen Papierkreis mit einem Durchmesser von 5 cm wünschen, kann ein Kreis mit einem Durchmesser von 4,5 oder 5,5 cm für eine Verwendung (z. B. für die Dekoration des Kinderzimmers zu Hause) akzeptabel sein, ein Kreis mit einem Durchmesser von 5,0 cm jedoch 1 mm hinzufügen oder abziehen ( dh innerhalb von 4,9 - 5,1 cm) wäre erforderlich, wenn es sich um ein Dekorationsprojekt für einen Projektstart für eine große, große Firma handelt.
Beispielsweise kann die Lade- / Entladezyklusspezifikation eines Heimlaufwerks etwa 300.000-fach sein, die Lade- / Entladespezifikation eines Unternehmenslaufwerks etwa 600.000-fach, was die Zahlen verdoppelt. Die strengere Spezifikation gilt auch für die Laufwerkbaugruppe und den Plattenherstellungsprozess - und daher wäre die nicht behebbare Lesefehlerrate für Enterprise-Laufwerke, z. B. ein typisches, aktuelles Heimlaufwerk - Caviar Black (von Western Digital), viel geringer Habe einen nicht behebbaren Lesefehler pro 10 ^ 14 Bit gelesen. Vergleichen Sie dies mit einer typischen Festplatte, die für Rechenzentrumsserver hergestellt wurde. WD RE SAS würde einen nicht behebbaren Lesefehler pro 10 ^ 15-Bit-Lesevorgang aufweisen. Ob Ihnen das 10-fache an Zuverlässigkeit wichtig ist, ist eine andere Frage.
Um ehrlich zu sein, ist es wahrscheinlich wichtiger, wie Sie das Laufwerk verwenden, als welches Laufwerk Sie verwenden. Im Folgenden finden Sie eine Zusammenfassung der Ergebnisse von Google:
- 6-7% der Laufwerke fallen innerhalb des ersten Betriebsjahres aus. Innerhalb von 6 Monaten fällt mehr als die Hälfte dieser fehlerhaften Laufwerke aus. Diese Laufwerke sind in diesen Zeiträumen in der Regel stark ausgelastet.
- Der Ausfall des Frequenzumrichters folgt einem Doppelspitzenmodell. Der erste Peak liegt innerhalb von 3 Monaten und der zweite Peak liegt bei 3 Jahren.
- Nach dem ersten Jahr liegt die jährliche Ausfallrate der Festplatte bei 8%.
- Die Auswirkung der Temperatur ist zweifach: [1] Die niedrigste Ausfallrate wird bei Festplatten mit einer Temperatur um 40 ° C beobachtet. [2] Mit zunehmendem Alter des Laufwerks steigt die Ausfallrate mit der Temperatur im dritten Jahr exponentiell an. Um diese Aussage zu interpretieren, würde ein Betrieb des Laufwerks bei ~ 35 ° C den besten Kompromiss aus Langlebigkeit und frühen Ausfällen erzielen. Wenn Ihre Festplatte alle 2 Jahre ausgetauscht werden kann, würde ein Betrieb der Laufwerke mit einer Temperatur von 45 ° C im Allgemeinen die Ausfallrate verringern. Aber nach dem zweiten Jahr wird es einen exponentiellen Anstieg geben, wenn Sie es bei 45 ° C laufen lassen.
- Wenn Sie eine SMART-Berichterstellungssoftware verwenden (eine davon ist die Crystal Disk Info-URL: http://crystalmark.info/software/CrystalDiskInfo/index-e.html ), schlagen 10% innerhalb von Tagen fehl 30% der Festplatte fallen innerhalb von 6 Monaten aus. Sichern und verwerfen Sie daher das Laufwerk entsprechend, nachdem Sie das erste angezeigt haben. Wenn Sie ein Neuzuweisungsereignis sehen, schlagen 10% innerhalb von ~ 4 Monaten fehl. Beachten Sie jedoch, dass nur 60% aller Festplattenfehler vom SMART-System vorhergesagt werden.
Aktualisieren
MTBF Die
mittlere Zeit zwischen Ausfällen ist für die typischen Verbraucher grundsätzlich nicht sehr nützlich. Die mittlere Zeit zwischen Ausfällen ist normalerweise ideal und theoretisch . Nehmen wir an, wir haben 500.000 Laufwerke mit einer MTBF von 500.000 Stunden - wenn Sie jedes einzelne von ihnen zusammen fahren, werden Sie es tunWahrscheinlich fällt statistisch gesehen jede Stunde eine davon aus, wenn Sie die Spezifikationen einhalten (Temperatur, Luftfeuchtigkeit, Qualität des Netzteils ...). In Bezug auf die Google-Studie wäre die realistische Nutzungsdauer einer Festplatte eher gleich 2 Jahre (in einem nicht redundanten System) oder 3 Jahre (in einem redundanten System) - wenn Sie es 24 Stunden am Tag verwenden - In einem redundanten System (z. B. einem RAID- [5,6]) können Sie eine Festplatte ohne verlieren Daten verlieren. Insbesondere in RAID 6 können Sie eine Festplatte verlieren und dennoch Redundanz während des Wiederherstellungsprozesses haben.
Lebensdauer
Einige Hersteller geben häufig die Lebensdauer an, z. B. '5 Jahre', und geben Ihnen dann eine Garantie von '3 Jahre'. Übersetzung: "Wir glauben, dass es etwa 5 Jahre dauern sollte. Wenn es innerhalb der ersten drei Jahre der Nutzung ausfällt, werden wir es auf unsere Kosten ersetzen, aber wenn Sie es zwischen dem 3. und 5. Jahr ausgefallen haben, arm Sie. Es sicher wird nicht der Fall sein, dass wir eine Art Zeitbombe installiert haben, um sie zum fünften Geburtstag unbrauchbar zu machen, aber Sie sollten sich eine neue Festplatte zulegen und anstelle dieser 5 Jahre alten Festplatte verwenden, wenn Ihre Daten wertvoll sind. "
So definieren sie es, wie ich es verstanden habe.
Zu guter Letzt lesen Sie das Google Paper, es ist eine ausgezeichnete Lektüre.