SMART-Test endet nie


17

Wenn SMART-Tests mit Smartmontools ausgeführt werden, werden sie NIEMALS beendet. Ich bekomme immer "Interrupted (Host Reset.)" Auf verschiedenen Systemen und Festplatten, einschließlich Debian in x86 und ARM, OS X auf x64, mit externen und internen Laufwerken. Selbst wenn im Captive-Modus alle Festplatten leer sind (mit dd auf Null gesetzt).

Was mache ich falsch?


Du machst nichts falsch. Es ist die Hardware, die nicht funktioniert
Ramhound

Soll es überhaupt funktionieren?
Max Ried

Ja, es sollte funktionieren
Ramhound

@MaxRied, sagen Sie, Sie haben dies auf vielen verschiedenen Computern mit Protokollen verschiedener Festplatten versucht und noch nie eine Fertigstellung gesehen, selbst bei Festplatten, von denen Sie wissen, dass sie mit einem anderen SMART-Analysetool fehlerfrei sind?
Frank Thomas

@FrankThomas Ja.
Max Ried

Antworten:


14

Wenn das Laufwerk während des Tests keine Eingabe- / Ausgabeaktivität verarbeitet, wird es möglicherweise in den Standby-Modus versetzt, wodurch der Interrupted (host reset)Zustand erhöht wird. Versuchen Sie, in geeigneten Abständen von der Festplatte zu lesen:

while true; do dd if=/dev/disk1 of=/dev/null count=1; sleep 60; done

(durch /dev/disk1das entsprechende Gerät ersetzen ; liest alle 60 Sekunden einen Sektor von diesem Gerät, bis Sie drücken ctrl-c)

Dies hat in meiner Umgebung geholfen: OS X 10.6.8, USB-Laufwerk mit WD Elements, SAT-SMART-Treiber 0.8.

Ein Captive-Test sollte das Laufwerk theoretisch online halten. Der Hardwarebefehl, der von gesendet wird, smartctlkann jedoch vor Abschluss des Tests eine Zeitüberschreitung aufweisen, was dazu führt, dass der Kernel die Verbindung zurücksetzt und in der gleichen Situation wie oben endet ( Fehler Nr. 303 ).

Weitere Informationen finden Sie in diesem Thread auf der Smartmontools-Support-Mailingliste. Ich danke Christian Franke für die hier gegebenen Erkenntnisse.


Andere mögliche Unterbrechungen ( serverfault.com/a/584055 ): Ein fehlerhaftes Kabel kann zu Zeitüberschreitungen führen, und der Kernel löst einen Reset aus. Ich bin mir weniger sicher, ob es notwendig ist, smartd zu stoppen. Alle Zeitüberschreitungen und Unterbrechungen werden in dmesg / kern.log / angezeigt journalctl -fk.
Tobu

Wow, das ist verrückt! Bestätigung - Nachdem ein HGST HDN726060ALE610 von einem Zpool-Spiegel fallen gelassen wurde, blieb er 36 Stunden lang bei 10% hängen (ohne andere Aktivität wird er schneller beendet, RICHTIG?). Fünf Minuten dieser winzigen dd-Lesevorgänge führten dazu, dass es zu Ende ging. Skepsis abgewiesen.
Bill McGonigle

Soll /dev/disk1das Gerät oder die Partition sein, dh wie /dev/sdaoder /dev/sda1?
Merchako

@ Merchako Dies ist Mac OS verwandt, wo es tatsächlich so ist.
Max Ried

5

Ich habe die Lösung von Tobu ausprobiert. In meinem Fall habe ich das externe USB-Laufwerk immer wieder im Energiesparmodus gefunden, unabhängig davon, ob der Test gestartet und unterbrochen wurde. Es scheint, dass dd aus einem Kernel-Cache gelesen hat und der Cache groß genug für die Festplatte war um in den Schlafmodus zu wechseln. Ich bemerkte, dass das Aufrufen von smartctl, um nach dem Status zu fragen, die Festplatte immer "aufwecken" konnte. Also: Diese Version derselben Idee hat den Trick für mich getan:

sudo bash -c 'while true; do smartctl -a /dev/sdb > /dev/null; sleep 60; done'

Nach 5 Stunden dreht sich das externe USB-Laufwerk immer noch. Zum ersten Mal konnte ich einen langen Test von smartctl auf einer externen Festplatte sehen.

Ich glaube, diese Lösung hat auch den Vorteil, dass die Plattenköpfe nicht unnötig jede Minute bewegt werden. Der Langzeitlauf endete fast genau in der vorhergesagten Zeit (das Keep-Awake-Skript fügte dem Lauf keine Zeit hinzu).


3

Eine Variation von Aris Antwort ist zu verwenden watch, da die smartctlAusgabe tatsächlich interessant sein kann, um den Status zu verfolgen:

sudo watch -d -n 60 smartctl -a /dev/sdx

Dadurch wird die Ausgabe smartctl -aalle 60 Sekunden automatisch aktualisiert , sodass Sie sehen können, wie viel Zeit für den Selbsttest noch vorhanden ist, und die Änderungen hervorheben können (damit Sie leichter erkennen können, dass der Test tatsächlich fortschreitet).


+1, noch nie gesehen watch.
Hashim

1

Der Captive-Test funktioniert möglicherweise nicht, wenn er länger als 20 Sekunden dauert.

Quelle: Ticket Nr. 303 mit dem Titel "Verlängern Sie im Smart Test Captive-Modus das vom ATA-Gerät beschriebene Zeitlimit".

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.