So ermitteln Sie, welche Festplatte in einem FreeNAS / ZFS-Setup fehlgeschlagen ist


12

Ich baue einen FreeNAS-basierten Server in einem Supermicro X6DHE-XB 3U-Gehäuse mit 4 GB RAM und 16 SATA-Hot-Swap-Schächten auf. Es wird mit 2W8-Port-3Ware-RAID-Karten geliefert, aber ich plane, nur die ZFS-Funktionen anstelle des Hardware-RAID zu verwenden. Mein anfänglicher Laufwerkssatz sind 8x2 TB HITACHI Deskstar 7K3000 HDS723020BLA642-Laufwerke.

Wenn ich hardwarebasiertes RAID verwenden würde, würde dies ein rotes Licht auf dem Laufwerksschacht geben, in dem das Laufwerk ausgefallen ist. Wie funktioniert es mit ZFS, wenn ein Laufwerk ausfällt? Ich glaube nicht, dass es eine Garantie dafür gibt, dass sda = bay1, sdb = bay2 usw. Wie bestimmen Sie also, welches Laufwerk ersetzt werden muss? Kann sich ZFS an den SATA-Controller melden, um die Anzeige "Fehlerhaftes Laufwerk" einzuschalten? Gibt es nur die Seriennummer des Laufwerks an? Was passiert, wenn das Laufwerk so stark ausfällt, dass es seine Seriennummer nicht melden kann? Ich nehme an, es ist eine gute Idee, die Seriennummer jedes Laufwerks und den Schacht, in den es gegangen ist, aufzuschreiben, bevor Sie live gehen. Gibt es noch andere "Vorproduktions" -Aufgaben, die das Ersetzen von Laufwerken in Zukunft erleichtern sollen?

Antworten:


4

zpool status -v sollte Ihnen sagen, welche Festplatte online ist oder nicht.


3
+1 FreeNAS basiert auf FreeBSD und die Laufwerke befinden sich in der von der Karte angegebenen Reihenfolge. Wenn es einen einzelnen 8-Port-SAS-Controller gibt, sind die Laufwerke / dev / da0 bis / dev / da7 mit der gleichen Nummerierung wie die Karte (gute Kabel sind auch pro Laufwerk gekennzeichnet). Wenn Sie mehrere Controller haben oder etwas Kompliziertes, können camcontrol devlistSie eine Liste aller SAS / SCSI-Laufwerke abrufen und feststellen, auf welcher Karte, welchem ​​Ziel und auf welcher Karte sie sich befinden.
Chris S

1
Chris S ist falsch. Die Laufwerke werden nicht immer in der von der Karte angegebenen Reihenfolge angezeigt. Zum Beispiel erscheint unser "da7" an zweiter Stelle in der Liste der 8 Laufwerke ... Außerdem gibt der Zpool-Status lediglich die Beschriftungen und nicht die tatsächlichen Festplatten an.
Brian Knoblauch

8

Die aktuelle Version von FreeNAS (derzeit Version 9.3) erstellt ein Gptid für jedes Laufwerk, das einem Zpool hinzugefügt wird. Unmittelbar nach der Erstellung sieht der "Zpool-Status" ungefähr so ​​aus (abhängig von Ihrer Pool-Konfiguration) ...

# zpool status
pool: myzfstest
state: ONLINE
scan: keine
angeforderte Konfiguration:

    NAME                                            STATE     READ WRITE CKSUM
    myzfstest                                       ONLINE       0     0     0
      raidz-0                                       ONLINE       0     0     0
        gptid/4fc2b789-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/51d38480-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/54c672cc-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/56a07638-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
      raidz2-1                                      ONLINE       0     0     0
        gptid/630e1317-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/6557b52d-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/667a1318-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/68cadf75-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
    logs
      mirror-2                                      ONLINE       0     0     0
        gptid/8839f22e-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
        gptid/8a6d0b14-7b7f-11e4-9585-de9b81338d40  ONLINE       0     0     0
    cache
      gptid/8c2f3824-7b7f-11e4-9585-de9b81338d40    ONLINE       0     0     0
      gptid/8da9ba80-7b7f-11e4-9585-de9b81338d40    ONLINE       0     0     0
    spares
      gptid/72f039f2-7b8a-11e4-9585-de9b81338d40    AVAIL
      gptid/750df91d-7b8a-11e4-9585-de9b81338d40    AVAIL

Fehler: Keine bekannten Datenfehler

Leider zeigt Ihnen die Web-GUI diese Zahlen nicht an. Wenn Sie also eine Fehlermeldung erhalten, dass "gptid / 6557b52d-7b7f-11e4-9585-de9b81338d40" schlecht ist ... woher wissen Sie, welches Laufwerk Sie ziehen müssen? Das Herausfinden dieses Teils erfordert zum Zeitpunkt der Installation einige Beinarbeit.

  1. Wenn Sie Ihr System erstellen. Notieren Sie sich die Seriennummer jedes Laufwerks und den Ort, an dem das Laufwerk eingesetzt wurde. In einem doppelseitigen JBOD-Fall möchten Sie möglicherweise Vorder- / Rückseite, Zeile und Spalte notieren.
  2. Wenn Sie FreeNAS starten, gehen Sie in der Web-GUI zu "Speicher> Volumes / View Disks". Auf dieser Registerkarte sollten Sie eine Liste aller Ihrer Laufwerke und deren Seriennummern haben. Notieren Sie den Laufwerksnamen für jede Seriennummer, die Sie in der vorherigen Liste hatten. Wenn Sie die Seriennummern nicht sehen, müssen Sie zur Shell smartctl -a /dev/ada0 | grep ^Serialwechseln und Folgendes eingeben (indem Sie "/ dev / ada0" durch jeden Laufwerksnamen aus der Liste ersetzen).
  3. Jetzt müssen wir in der Shell die Laufwerksnamen mit allen Gptid-Nummern abgleichen. Also, tippe glabel statusund du solltest so etwas bekommen ...

    # glabel status
    
    CORRECT>glabel status (y|n|e|a)? yes    
                                          Name  Status  Components  
                                 ufs/FreeNASs3     N/A  ada0s3  
                                 ufs/FreeNASs4     N/A  ada0s4  
                                ufs/FreeNASs1a     N/A  ada0s1a
    gptid/616cddb6-7b7f-11e4-9585-de9b81338d40     N/A  ada0p2  
    gptid/630e1317-7b7f-11e4-9585-de9b81338d40     N/A  da1p1   
    gptid/6557b52d-7b7f-11e4-9585-de9b81338d40     N/A  da2p1   
    gptid/667a1318-7b7f-11e4-9585-de9b81338d40     N/A  da3p1   
    gptid/68cadf75-7b7f-11e4-9585-de9b81338d40     N/A  da4p1   
    
  4. Schreiben Sie nun alle gptid-Nummern ein, um sie mit den Laufwerksnamen und damit den Seriennummern und ihren Positionen zu verknüpfen. Hinweis : Wenn Sie so etwas wie "da3p1" sehen, ist dies die Partition eines der als da3 identifizierten Laufwerke. In der Liste in der Web-GUI wird nur die Bezeichnung "da3" für die Festplatte angezeigt.

Wenn nun ein Fehler auftritt, der besagt, dass eine Festplatte mit der Gptidnummer xyz einen Fehler aufweist, können Sie auf Ihr Blatt verweisen und wissen, welches Laufwerk Sie ziehen / ersetzen müssen.

Ich weiß, dass dies für das Originalplakat nicht mehr zu spät ist. aber vielleicht finden andere dies nützlich.


1
Für die ursprüngliche Frage ist "Glabel-Status" der kritische Teil. Auf diese Weise können Sie die Zuordnung zwischen den verrückten IDs und den physischen IDs herausfinden.
Brian Knoblauch

Beeindruckend. Tolle Antwort, aber es ist ein bisschen enttäuschend. ZFS hat keine halbwegs anständige Möglichkeit, den Überblick über Festplatten zu behalten.
Mikato

5

Was Sie brauchen, ist das Dienstprogramm sas2ircu von LSI (jetzt Avago). LSI verwaltet Versionen für FreeBSD, Linux und Windwos. Mit FreeNAS benötigen Sie die FreeBSD-Version.

Um es zu versuchen, legen Sie es im Verzeichnis / tmp ab und machen es zuerst ausführbar.

Schritt eins ist die Ermittlung der ID Ihres SAS-HBA (Beispiel):

/tmp# ./sas2ircu list
LSI Corporation SAS2 IR Configuration Utility.
Version 19.00.00.00 (2014.03.17)
Copyright (c) 2008-2014 LSI Corporation. All rights reserved.


         Adapter      Vendor  Device                       SubSys  SubSys
 Index    Type          ID      ID    Pci Address          Ven ID  Dev ID
 -----  ------------  ------  ------  -----------------    ------  ------
   0     SAS2008     1000h    72h   00h:04h:00h:00h      1000h   3020h
SAS2IRCU: Utility Completed Successfully.

Schritt zwei wäre eine Liste aller Ihrer Geräte, die Sie später untersuchen können:

/tmp# ./sas2ircu 0 display > disklist.txt

Schritt 3 überprüft Ihre Festplattenliste. Es wird ähnlich aussehen wie:

/tmp# vi disklist.txt
LSI Corporation SAS2 IR Configuration Utility.
Version 19.00.00.00 (2014.03.17)
Copyright (c) 2008-2014 LSI Corporation. All rights reserved.

Read configuration has been initiated for controller 0
------------------------------------------------------------------------
Controller information
------------------------------------------------------------------------
  Controller type                         : SAS2008
  BIOS version                            : 7.37.00.00
  Firmware version                        : 19.00.00.00
  Channel description                     : 1 Serial Attached SCSI
  Initiator ID                            : 0
  Maximum physical devices                : 255
  Concurrent commands supported           : 3432
  Slot                                    : 4
  Segment                                 : 0
  Bus                                     : 4
  Device                                  : 0
  Function                                : 0
  RAID Support                            : No
------------------------------------------------------------------------
IR Volume information
------------------------------------------------------------------------
------------------------------------------------------------------------
Physical device information
------------------------------------------------------------------------
Initiator at ID #0

Device is a Enclosure services device
  Enclosure #                             : 2
  Slot #                                  : 24
  SAS Address                             : 5003048-0-00d3-a87d
  State                                   : Standby (SBY)
  Manufacturer                            : LSI CORP
  Model Number                            : SAS2X36
  Firmware Revision                       : 0717
  Serial No                               : x36557230
  GUID                                    : N/A
  Drive Type                              : Undetermined

Device is a Enclosure services device
  Enclosure #                             : 3
  Slot #                                  : 0
  SAS Address                             : 5003048-0-00ca-7bfd
  State                                   : Standby (SBY)
  Manufacturer                            : LSI CORP
  Model Number                            : SAS2X28
  Firmware Revision                       : 0717
  Serial No                               : x36557230
  GUID                                    : N/A
  Drive Type                              : Undetermined

Device is a Hard disk
  Enclosure #                             : 4
  Slot #                                  : 0
  SAS Address                             : 5003048-0-00d3-a8cc
  State                                   : Ready (RDY)
  Size (in MB)/(in sectors)               : 1907729/3907029167
  Manufacturer                            : ATA
  Model Number                            : WDC WD20EARS-00M
  Firmware Revision                       : AB51
  Serial No                               : WDWCAZA1037887
  GUID                                    : N/A
  Drive Type                              : Undetermined

Device is a Hard disk
  Enclosure #                             : 4
  Slot #                                  : 1

Schritt 4 identifiziert Ihr ausgefallenes Laufwerk - Sie erkennen anhand der fehlenden oder beschädigten Informationen, die auf dem Laufwerk gemeldet wurden, welche. Holen Sie sich die Gehäusenummer und die Steckplatznummer und verwenden Sie diese, um die Fach-LED in Schritt 5 zu blinken: Um Gehäuse Nr. 4 zu finden, Steckplatz Nr. 0

 /tmp# ./sas2ircu 0 locate 4:1 ON

So schalten Sie die LED nach dem Austausch aus:

/tmp# ./sas2ircu 0 locate 4:1 OFF

Ich hoffe das hilft!


Einige freeNAS-Systeme benötigen möglicherweise sas3ircu
Brian Minton

2

Schau dir die Bände an.

Wählen Sie die Lautstärke aus, die beeinträchtigt wird.

Am unteren Bildschirmrand stehen drei Auswahlmöglichkeiten zur Verfügung: Klicken Sie auf Lautstärkestatus

Sie sehen nun eine Nahaufnahme des Volumes und seiner einzelnen Festplatten, die so etwas wie ada3p2, ada5p2, ada6p2, ada4p2 usw. aufgelistet sind.

Wählen Sie das verschlechterte Laufwerk aus.

Am unteren Bildschirmrand sehen Sie zwei Optionen. Datenträger bearbeiten und ersetzen

Wählen Sie Edit Disk

Sie sollten jetzt die Seriennummer der beschädigten Festplatte sehen.

Schalten Sie Ihren FreeNAS-Server aus und suchen Sie nach dieser Festplatte.


Dies sollte die richtige Antwort sein. Als ich dies tat, fand ich eine vollständige Liste aller angehängten Serien, daher muss die nicht angehängte die fehlerhafte sein! Vielen Dank @ wri7913
Delta_zulu

1

Dies setzt voraus, dass Sie ein Gehäuse mit individuellen HD-Lichtern haben (auch bekannt als Servergehäuse).

Finden Sie die Liste für das Laufwerk, das schlecht ist. Beispiel / dev / da9, /dev/sda...etc

Offline diese Festplatte mit den GUI- oder FreeNAS-Terminalbefehlen.

Führen Sie DD aus, um diese Festplatte in / dev / null zu lesen, während Sie auf der Vorderseite des Servers nach dem Licht suchen, das jetzt wahnsinnig blinkt.

sudo dd if=/dev/da# of=/dev/null

Notieren Sie sich den Speicherort der Festplatte, brechen Sie den DD-Befehl (Strg-C) ab und führen Sie dann Ihre Ersetzungsmethode aus. Laden Sie für freeNAS die neue Festplatte hoch, klicken Sie auf die Schaltfläche GUI Replace und beenden Sie diesen Vorgang. Wenn Sie fertig sind, entfernen Sie das fehlerhafte Laufwerk und machen Sie damit, was Sie wollen. Testen Sie es mehr, sichern Sie es, löschen Sie es, zerstören Sie es physisch, senden Sie es zur Garantiereparatur ab ..... usw.


0

Der einfachste Weg, den ich gefunden habe.

Klicken Sie auf Speicher. Klicken Sie auf Laufwerke anzeigen.

Ziehen Sie ein SATA-Kabel ab. Drucken Sie das Etikett mit dem fehlenden Laufwerk von der Ansichtsplatte, auch bekannt als ada1-Stick-Etikett, auf die Seite des Laufwerks.

Laufwerk wieder anschließen. Ziehen Sie das zweite SATA-Kabel vom Drucketikett ada2 usw. ab

Wenn dann ein Laufwerk ausfällt, kennen Sie dessen ada2

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.