Wie kann man smartd dazu bringen, einen bestimmten, nicht korrigierbaren Offline-Sektor zum Schweigen zu bringen?


18

Ich habe eine Festplatte in einem Software-RAID-1 mit zwei Festplatten, für die kürzlich ein "nicht korrigierbarer Offline-Sektor" im SMART-Status angezeigt wurde.

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

Dies ist anscheinend nur ein Anzeichen für einen bevorstehenden Festplattenausfall, wenn dieser häufiger auftritt (und da das Laufwerk gespiegelt ist, besteht auch kein großes Risiko für einen tatsächlichen Datenverlust). Zu der Zeit schlug irgendwann auch ein Selbsttest fehl und smartdschickte mir eine E-Mail, um mich darüber zu informieren, wie es natürlich sein sollte.

Beim Schreiben in den beschädigten Sektor wird jedoch normalerweise einer der Ersatzsektoren des Datenträgers verwendet, was anscheinend ddder Fall war, da alle Selbsttests ohne Probleme durchgeführt wurden, da ich über den Datenträger hinweggearbeitet habe. Und badblocksauch keinen Grund gefunden, sich zu beschweren.

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

Die Anzahl fehlerhafter Sektoren hat sich jedoch nicht verringert, was eigentlich nicht der Fall sein sollte, da der defekte Sektor immer noch vorhanden ist, obwohl er nicht genutzt wird. smartdSendet mir jedoch weiterhin jede Nacht E-Mails:

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

Das ist natürlich extrem nervig und betäubt meinen gesunden Panikreflex bei smartdMails.

Die Festplatte ist eine Western Digital WD20EARS und die smartdVersion ist 5.41 2011-06-09 r3365.

Antworten:


23

Auf einigen Datenträgern müssen Sie möglicherweise auf -U 198+(oder -U +?) In der Konfigurationsdatei zurückgreifen .

Seien Sie bitte vorsichtig. Wenn Sie nicht der ursprüngliche Fragesteller sind, lesen Sie die gesamte Frage sorgfältig durch. Wenn Sie dies auf einem Datenträger verwenden, der es nicht benötigt, werden vollständig gültige Warnungen unterdrückt.

Wenn ´ + ´ angegeben ist, wird ein Bericht nur gedruckt, wenn sich die Anzahl der Sektoren seit dem letzten Prüfzyklus erhöht hat. Einige Datenträger setzen dieses Attribut nicht zurück, wenn ein fehlerhafter Sektor neu zugeordnet wird. Siehe auch ´-v 198, weiter unten.

smartd.conf (5)

Angenommen, Sie verwenden die Standardkonfiguration in smartd.conf. In diesem Fall enthält die Datei viele Kommentare. Die einzige Zeile, die keine Kommentare enthält, ist hier:

# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN

Fügen Sie die Option am Ende der Zeile hinzu:

DEVICESCAN -U 198+

1
-U 198+Sollte es tun. Nizza zu finden!
Michael Hampton

irgendwelche Beispiele dafür?
JIV

1
@JIV bearbeitet. Ich habe auch eine Warnung hinzugefügt. Bitte gehen Sie mit Ihren Daten sorgfältig um :-).
Sourcejedi

0

Es gibt zwei Möglichkeiten, woher diese Mails kommen. smartd ist in der Lage, E-Mails selbst zu senden, aber höchstwahrscheinlich nicht so konfiguriert, sodass ich davon ausgehe, dass diese E-Mails von logcheck gesendet werden. Wenn diese Annahme falsch ist, müssen Sie nicht weiter lesen.

logcheck scannt Protokolldateien und sendet E-Mails, wenn Sie der Meinung sind, dass Sie sich über alles Gedanken machen sollten, was mit / auf Ihrem System passiert ist.

Sie haben die Möglichkeit, eine Logcheck-Ignorierregel zu schreiben, die logcheck anweist, keine Nachrichten zu senden, die einem bestimmten Muster entsprechen.

Sie können (unter Debian-basierten Systemen) eine Datei mit dem Namen "/etc/logcheck/ignore.d.server/smartd_own" mit folgendem Inhalt erstellen:

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

Dies sollte die lästigen Mails herausfiltern, aber Sie erneut schreiben, wenn der Zähler für nicht korrigierbare Sektoren zunimmt.


smartdSendet die Nachrichten leider direkt. Es ist anscheinend immer eine Option, dies zu ändern. Ich werde das überlegen, wenn es keinen anderen Weg gibt, also danke!
Christian

Oh verdammt, trotzdem haben Sie jetzt einen Workaround.
Hennr
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.