Der Punkt der aktuellen / schlechtesten Eigenschaften wie der Temperatur ist genau dieser: um Ihnen mitzuteilen, ob der Antrieb jemals seine maximale Betriebstemperatur überschritten hat und somit bleibende Schäden erlitten haben könnte.
Deshalb heißt es "in der Vergangenheit fehlgeschlagen", nicht "jetzt fehlgeschlagen": Sie haben die Höchsttemperatur-Schwelle nur knapp berührt. Beachten Sie, dass in der Attributanzeige "normalisiert: 50, Schwelle: 45, schlechteste: 45" angezeigt wird. (Dies sind 0..200 normalisierte Werte wie für jedes andere Attribut, nicht rohe Celsius-Temperaturen.)
Sie haben auch einige fehlerhafte Sektoren (nicht korrigierbare Sektorenfehler). Es ist also wahrscheinlich an der Zeit, dieses Laufwerk außer Betrieb zu setzen, unabhängig davon, ob die kurze, hohe Temperatur dies verursacht hat oder nicht.
Eine bessere Benutzeroberfläche für die SMART-Software zeigt Ihnen die aktuelle und höchste Temperatur . zB
smartctl -a /dev/sda
oder smartctl -x /dev/sda
( -x
druckt alle verfügbaren SMART- und Nicht-SMART-Daten, die vom Laufwerk abgerufen werden können, einschließlich eines Temperaturverlaufsprotokolls (falls vorhanden), mit einem ASCII-Balkendiagramm.)
smartctl -x enthält dies für eine alte WD Green 1 TB (WD10EADS) -Festplatte:
Current Temperature: 36 Celsius
Power Cycle Min/Max Temperature: 25/42 Celsius
Lifetime Min/Max Temperature: 35/46 Celsius
Die Software, die Sie verwenden, scheint nur die aktuelle Temperatur anzuzeigen, die etwas unter dem Schwellenwert liegt, aber es wird nicht die Tatsache verbergen, dass das Laufwerk zu einem bestimmten Zeitpunkt in der Vergangenheit nicht den Spezifikationen entsprach.
Sie könnten es durchaus rechtfertigen, diese momentane Hochtemperatur zu ignorieren, wenn Sie sie wirklich innerhalb von Minuten korrigieren würden. Aber Sie werden (oder sollten) niemals in der Lage sein, das Laufwerk selbst zum Lügen zu bringen, weil es für einige Zeit über der angegebenen Maximaltemperatur lag und das Attribut in der Vergangenheit fehlgeschlagen ist.
Sie können so konfigurieren smartd
, dass ein bestimmtes Attribut ignoriert wird, sodass Sie weiterhin eine nützliche Benachrichtigung erhalten, wenn etwas anderes einen Schwellenwert in ein Gebiet überschreitet, das offiziell nicht funktioniert. : smartd.conf(5)
sagt:
-i ID [ATA only]
Ignorieren Sie die ID der Geräteattributnummer, wenn Sie prüfen, ob die Verwendungsattribute fehlerhaft sind. ID muss eine Dezimalzahl im Bereich von 1 bis 255 sein. Diese Direktive ändert das Verhalten der '-f'-Direktive und hat ohne sie keine Auswirkung.
Dies ist beispielsweise dann nützlich, wenn Sie eine sehr alte Festplatte haben und nicht ständig Nachrichten über das Fehlschlagen des Attributs "Stunden auf Lebenszeit" (normalerweise Attribut 9) erhalten möchten. Diese Direktive kann für ein einzelnes Gerät mehrmals vorkommen, wenn Sie mehrere Attribute ignorieren möchten.
Erweiterte Temperaturverlaufsattribute
Ich habe gerade einen neuen 6-TB-Seagate-Barracuda (ST6000DM003-2CY186-Firmware 0001, ein Laufwerk mit 5425 U / min ) erhalten, der einige interessante Statistiken enthält, einschließlich der Zeit, die für das Überschreiten von Min / Max-Betriebspunkten und des Hochs / Tiefs von Kurzzeit- und Log-Temps aufgewendet wurde .
SCT Status Version: 3
SCT Version (vendor specific): 522 (0x020a)
Device State: Active (0)
Current Temperature: 33 Celsius
Power Cycle Min/Max Temperature: 27/33 Celsius
Lifetime Min/Max Temperature: 27/33 Celsius
Under/Over Temperature Limit Count: 0/0
SCT Temperature History Version: 2
Temperature Sampling Period: 3 minutes
Temperature Logging Interval: 59 minutes
Min/Max recommended Temperature: 14/55 Celsius
Min/Max Temperature Limit: 10/60 Celsius
Temperature History Size (Index): 128 (2)
Und im ausführlichen Abschnitt:
0x05 ===== = = === == Temperature Statistics (rev 1) ==
0x05 0x008 1 33 --- Current Temperature
0x05 0x010 1 - --- Average Short Term Temperature
0x05 0x018 1 - --- Average Long Term Temperature
0x05 0x020 1 33 --- Highest Temperature
0x05 0x028 1 30 --- Lowest Temperature
0x05 0x030 1 - --- Highest Average Short Term Temperature
0x05 0x038 1 - --- Lowest Average Short Term Temperature
0x05 0x040 1 - --- Highest Average Long Term Temperature
0x05 0x048 1 - --- Lowest Average Long Term Temperature
0x05 0x050 4 0 --- Time in Over-Temperature
0x05 0x058 1 55 --- Specified Maximum Operating Temperature
0x05 0x060 4 0 --- Time in Under-Temperature
0x05 0x068 1 13 --- Specified Minimum Operating Temperature
(Das Laufwerk ist erst seit ein paar Minuten eingeschaltet. Vermutlich gibt es deshalb -
in einigen Feldern ein for no data.)
Wenn Sie mit diesen erweiterten Attributen fahren, können Sie jemandem zeigen, dass die Zeit, die Sie außerhalb der zulässigen Zeit verbracht haben, sehr kurz war (falls dies der Fall ist). Wenn Sie wahrscheinlich die SMART-Daten ändern würden, hätten Sie dies einfach getan und jede Erwähnung entfernt, dass sie sich jemals außerhalb der Reichweite befänden, aber offensichtlich können Sie keinen Daten von einem Zweithand-Laufwerk, das diese Daten enthält, 100% vertrauen jemand versucht dich zu verkaufen.
Unter /superuser/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-that-shouldnt-exist- für weitere Informationen zu verwendeten Laufwerken mit Beispiel: "Rollback des Kilometerzählers" für das Attribut "Power_On_Hours".