Ich habe einen HP ProLiant DL380 G7-Server, der als NexentaStor-Speichereinheit ausgeführt wird . Der Server verfügt über 36 GB RAM, 2 SAS-Controller LSI 9211-8i (keine SAS-Erweiterungen), 2 SAS-Systemlaufwerke, 12 SAS-Datenlaufwerke, eine Hot-Spare-Festplatte, einen Intel X25-M L2ARC-Cache und einen DDRdrive PCI ZIL-Beschleuniger. Dieses System stellt NFS für mehrere VMWare-Hosts bereit. Ich habe auch ungefähr 90-100 GB deduplizierte Daten auf dem Array.
Ich hatte zwei Vorfälle, in denen die Leistung plötzlich nachließ und die VM-Gäste und Nexenta SSH / Web-Konsolen nicht mehr zugänglich waren und ein vollständiger Neustart des Arrays erforderlich war, um die Funktionalität wiederherzustellen. In beiden Fällen war es die Intel X-25M L2ARC SSD, die ausfiel oder "offline" war. NexentaStor hat mich nicht über den Cache-Fehler informiert, die allgemeine ZFS-FMA-Warnung wurde jedoch auf dem (nicht reagierenden) Konsolenbildschirm angezeigt.
Die zpool status
Ausgabe zeigte:
pool: vol1
state: ONLINE
scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:
NAME STATE READ WRITE CKSUM
vol1 ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
c8t5000C50031B94409d0 ONLINE 0 0 0
c9t5000C50031BBFE25d0 ONLINE 0 0 0
mirror-1 ONLINE 0 0 0
c10t5000C50031D158FDd0 ONLINE 0 0 0
c11t5000C5002C823045d0 ONLINE 0 0 0
mirror-2 ONLINE 0 0 0
c12t5000C50031D91AD1d0 ONLINE 0 0 0
c2t5000C50031D911B9d0 ONLINE 0 0 0
mirror-3 ONLINE 0 0 0
c13t5000C50031BC293Dd0 ONLINE 0 0 0
c14t5000C50031BD208Dd0 ONLINE 0 0 0
mirror-4 ONLINE 0 0 0
c15t5000C50031BBF6F5d0 ONLINE 0 0 0
c16t5000C50031D8CFADd0 ONLINE 0 0 0
mirror-5 ONLINE 0 0 0
c17t5000C50031BC0E01d0 ONLINE 0 0 0
c18t5000C5002C7CCE41d0 ONLINE 0 0 0
logs
c19t0d0 ONLINE 0 0 0
cache
c6t5001517959467B45d0 FAULTED 2 542 0 too many errors
spares
c7t5000C50031CB43D9d0 AVAIL
errors: No known data errors
Dies löste keine Warnungen in Nexenta aus.
Ich hatte den Eindruck, dass ein L2ARC-Fehler das System nicht beeinträchtigen würde. Aber in diesem Fall war es sicherlich der Schuldige. Ich habe noch nie Empfehlungen für RAID L2ARC gesehen. Durch das vollständige Entfernen der fehlerhaften SSD vom Server wurde ich wieder in Betrieb genommen, aber ich bin besorgt über die Auswirkungen des Gerätefehlers (und möglicherweise auch über das Fehlen einer Benachrichtigung von NexentaStor).
Bearbeiten - Was ist das aktuelle beste Wahl SSD für L2ARC Cache - Anwendungen in diesen Tagen?