Hintergrund
In meinem privaten Desktop-System sind 5 SATA-Laufwerke installiert. Kürzlich fing mein System an, auf seltsame Weise wie zufällige Kernel-Panics zu versagen, und ich habe es schließlich auf zufällige Verschlechterungen des RAID-Arrays zurückgeführt. Manchmal konnte ich booten, manchmal nicht und so weiter. Nachdem ich eine Weile nach Software-Problemen gesucht hatte, zog ich endlich die Laufwerke heraus und stellte fest, warum sie versagten: Sie waren heißer als ein Grillabend am 4. Juli! Der vordere Gehäuselüfter hatte sich festgefahren, und der PS-Lüfter hatte einen losen Netzstecker im Rost, sodass das Innere des Gehäuses gekocht hatte.
Als Zwischenstopp fand ich einen Hausventilator und ließ den Sauger abkühlen. Es lief großartig mit allem, was schön und kalt war. Ungefähr zu dieser Zeit lernte ich, wie man von SMART Laufwerkstemperaturwerte abruft
for i in a b c d e; do
sudo smartctl --all /dev/sd$i | grep Temperature_Celsius
done
Jetzt weiß ich, dass bei geöffnetem Koffer ein Hausventilator die Spinnweben permanent ausräumt und die Laufwerke bei 31-32 ° laufen. Ein schneller Test ohne Belüftung, um den ausgefallenen Zustand zu reproduzieren, zeigt, dass die Laufwerke ziemlich schnell auf die hohen 40er gelaufen sind. Ich weiß nicht, wie schlimm es während des tatsächlichen Ausfalls war oder wie lange es so war.
In diesem Sinne habe ich die ausfallenden Lüfter ausgetauscht, ein paar mehr hinzugefügt, den vorderen Lüfter, der über die Laufwerke bläst, von 80 mm auf 120 mm verbessert und ihn wieder geschlossen. Wenn es wieder aufrecht steht, liegt der Temperaturbereich jetzt im Allgemeinen bei 32 ° unten und 37 ° oben.
Die Frage
Was ist ein allgemeiner sicherer Betriebstemperaturbereich für SATA-Laufwerke? Sollte 37 ° ein Problem sein oder ist ein Laufwerksschaden erst nach einem bestimmten Zeitpunkt ein Problem?
Obwohl sich die Laufwerke jetzt anscheinend gut testen lassen, wie wahrscheinlich ist es, dass sie in der Vergangenheit durch Hitzeeinwirkung zu Ausfällen neigen?