Ja, das ist ein Problem, vor allem, wenn die Laufwerksgrößen steigen. Die meisten SATA-Laufwerke weisen eine URE-Rate (nicht korrigierbarer Lesefehler) von 10 ^ 14 auf. Oder für jeweils 12 TB statistisch gelesener Daten gibt der Laufwerkshersteller an, dass das Laufwerk einen Lesefehler zurückgibt (Sie können diese normalerweise auf den Laufwerksdatenblättern nachschlagen). Das Laufwerk funktioniert weiterhin einwandfrei für alle anderen Teile des Laufwerks. Enterprise-FC- und SCSI-Laufwerke haben im Allgemeinen eine URE-Rate von 10 ^ 15 (120 TB), zusammen mit einer kleinen Anzahl von SATA-Laufwerken, was zu einer Reduzierung beiträgt.
Ich habe noch nie gesehen, dass die Festplatten exakt zur gleichen Zeit nicht mehr rotieren, aber ich hatte ein Raid5-Problem (vor 5 Jahren mit PATA-Laufwerken für Endverbraucher mit 5400 U / min). Das Laufwerk fällt aus, es ist als tot markiert und das Ersatzlaufwerk wird neu erstellt. Das Problem ist, dass während der Wiederherstellung ein zweites Laufwerk diesen einen kleinen Datenblock nicht lesen kann. Je nachdem, wer die Razzia durchführt, ist möglicherweise das gesamte Volume oder nur dieser kleine Block tot. Angenommen, es ist nur ein Block tot. Wenn Sie versuchen, ihn zu lesen, wird eine Fehlermeldung angezeigt. Wenn Sie jedoch darauf schreiben, ordnet das Laufwerk ihn einem anderen Speicherort zu.
Es gibt mehrere Methoden zum Schutz vor: raid6 (oder eine gleichwertige Methode), die vor dem Ausfall einer doppelten Festplatte schützt, zusätzliche Methoden sind ein URE-fähiges Dateisystem wie ZFS, das kleinere RAID-Gruppen verwendet, sodass Sie statistisch gesehen eine geringere Wahrscheinlichkeit haben, auf das URE-Laufwerk zu stoßen Grenzen (spiegeln große Laufwerke oder raid5 kleinere Laufwerke), Disk Scrubbing & SMART hilft auch, ist aber nicht wirklich ein Schutz für sich, sondern wird zusätzlich zu einer der oben genannten Methoden verwendet.
Ich verwalte fast 3000 Spindeln in Arrays, und die Arrays reinigen die Laufwerke ständig auf der Suche nach latenten UREs. Und ich erhalte einen ziemlich konstanten Strom von ihnen (jedes Mal, wenn es einen findet, behebt es ihn vor dem Laufwerksausfall und alarmiert mich), wenn ich raid5 anstelle von raid6 verwende und eines der Laufwerke komplett tot ist ... würde ich in Schwierigkeiten sein, wenn es bestimmte Orte trifft.