(Angenommen, Sie beziehen sich auf die Verwendung von Deduplizierung in ZFS im Vergleich zu Ihrer Sicherungssoftware.)
Ich würde nicht empfehlen, die native ZFS- Deduplizierung für Ihr Sicherungssystem zu verwenden, es sei denn, Sie entwerfen Ihr Speichersystem speziell dafür.
Die Verwendung von Deduplizierung in ZFS ist extrem RAM-intensiv. Da die Deduplizierung in Echtzeit erfolgt, während Daten in den Speicherpool gestreamt / geschrieben werden, wird im Speicher eine Tabelle verwaltet, die Datenblöcke verfolgt. Dies ist die DDT-Tabelle . Wenn Ihr ZFS-Speicherserver nicht über genügend RAM verfügt, um diese Tabelle aufzunehmen, leidet die Leistung erheblich. Nexenta wird Sie warnen, wenn der Tisch eine bestimmte Schwelle überschreitet, aber bis dahin ist es zu spät. Dies kann durch die Verwendung eines L2ARC-Geräts (Lese-Cache) ergänzt werden, aber viele frühe Anwender von ZFS sind in diese Falle geraten .
Sehen:
ZFS - Durch das Zerstören von dedupliziertem zvol oder Datensatz wird der Server blockiert. Wie erholt man sich?
ZFS - Auswirkungen eines L2ARC-Cache-Gerätefehlers (Nexenta)
Wenn ich sage, dass der RAM-Bedarf für die Verwendung von Deduplizierung hoch ist, würde ich den RAM- und L2ARC-Bedarf für den von Ihnen beschriebenen Datensatz auf 64 GB + RAM und 200 GB + L2ARC schätzen. Das ist keine geringe Investition. Wenn Sie viele Windows-Systemdateien und Bilddokumente behalten, die nicht erneut gelesen werden, wird dieser DDT sehr schnell gefüllt. Die Auszahlung ist möglicherweise nicht die technische Arbeit wert, die im Voraus geleistet werden muss.
Eine bessere Idee ist die Komprimierung des zpools, wobei möglicherweise die gzip-Funktionen für die komprimierbareren Datentypen genutzt werden. Eine Deduplizierung lohnt sich nicht, da es einen Treffer gibt, wenn Sie deduplizierte Daten löschen müssen (muss auf das DDT verweisen).
Wie werden Sie den Speicher Ihrer Sicherungssoftware präsentieren? Welche Backup-Software-Suite verwenden Sie? In Windows-Umgebungen präsentiere ich Backup Exec ZFS als Blockspeicher über iSCSI. Ich fand die ZFS CIFS-Funktionen nie robust genug und bevorzugte die Vorteile eines nativ formatierten Geräts.
Hier finden Sie auch eine hervorragende ZFS-Ressource für Designideen. Dinge über ZFS, die Ihnen niemand erzählt hat