Dies macht einen Unterschied. Es ist nur dann sinnvoll, wenn Sie die RAS-Funktionen (Zuverlässigkeit, Verfügbarkeit und Service) für x4- oder x8-Geräte benötigen und die Kompromisse für Ihre Anforderungen kennen. Weitere Informationen finden Sie im Dell Whitepaper Dell ™ PowerEdge ™ Server 2009 - Arbeitsspeicher .
Die Konfiguration und das Layout mit spezifischen Details für das R710 finden Sie auch im Technischen Handbuch für das PowerEdge R710 - (Google, da ich keinen guten Ruf für den Link habe).
Das wichtige Problem ist der Unterschied zwischen dem ECC auf dem Chip und dem "Advanced ECC", der vom Dell-BIOS für die Datenkorrektur einzelner Geräte (SDDC) bereitgestellt wird. Sie werden eine Auswirkung auf beide Leistung haben. Der ECC wird sich von Fehlern beim Schreiben auf den Chip erholen. SDDC geht jedoch noch einen Schritt weiter und organisiert die Bits so, dass ein gesamter Chip ausfallen kann und dennoch wiederherstellbar ist. Sehen Sie sich ein Beispiel und Details des SDDC E7500-Chipsatzes an
Die Frage ist, ob Ihre Leistung und / oder Zuverlässigkeit bei Ihrer spezifischen Nutzung der Maschine von größter Bedeutung sind. Wenn ein Chipausfall zu einem Verlust kritischer Daten oder zur Auslastung dieses Computers führt und die Implementierung nicht redundant ist, bietet sich Advanced ECC an. Sie tun dies jedoch mit einer Leistungseinbuße, die für Sie möglicherweise wichtiger ist.
Ich habe beides im Feld auf Dell PowerEdge-Servern für einzelne Microsoft SQL Server-Implementierungen implementiert. Wenn ich Ihnen weiterhelfen kann, kommentieren Sie mich einfach und lassen Sie es mich wissen.
Ich hoffe, das hilft.
EDIT: Deckungslücke / ECC-Implementierungen
Ja, es gibt eine Abdeckungslücke, auch wenn Sie beide implementieren. Da Sie speziell einen Cluster von Hochverfügbarkeitsservern verwenden, sollten Sie IMHO Advanced ECC verwenden. Ihre Leistungseinbußen sind im Vergleich zu den Vorteilen für die Clustergeräte minimal. Laut Crucial sinkt die Leistung des ECC-Speichers im Allgemeinen nur um 2% .
Die Lücke wäre spezifischer für die Art der auftretenden Fehler und für die Art und Weise, wie die Fehler behandelt werden. In Ihrer speziellen Situation sollte dies nicht zu Datenverlust führen. Da es sich um ein Enterprise-DBMS handelt, werden Fehler, Parallelitätsprobleme usw. auf Softwareebene verwaltet, um Datenverlust zu vermeiden. Ein detaillierter Verlauf der Änderungen in einem ordnungsgemäß konfigurierten DBMS wird gespeichert, und die Software, die das DBMS verwendet, kann in der Regel so einrichten, dass die Transaktion zurückgesetzt wird, wenn ein schwerwiegender Fehler auftritt.
ECC-Implementierungen
Der ECC versucht, Bitfehler beim Lesen / Schreiben im Speicher zu korrigieren. Wenn jedoch der Fehler mehr signifikant ist, dann nicht einmal wird ECC der Lage sein , sich zu erholen, was potenzielle Datenverlust. Es gibt mehr Diskussionen über ECC auch bei ServerFault / Was ist ECC-RAM und warum ist es besser?
Laut Wikipedia auf ECC_Memory
ECC-Speicher hält ein Speichersystem effektiv frei von Einzelbitfehlern ...
SDDC
Wenn Sie sich auf das obige Dokument zum E7500-Chipsatz beziehen (beachten Sie, dass der 55xx / 56xx von Intel eine Anmeldung / Partnerschaft erfordert, aber die Idee ist ähnlich, weshalb ich ursprünglich keine Verknüpfung hergestellt habe), beschreibt SDDC und wie es möglich gemacht wurde. Grundsätzlich verwendet es eine Technik zum Organisieren der in den Speicher geschriebenen Wörter, die sicherstellt, dass alle so geschrieben sind, dass jedes Wort nur einen Einzelbitfehler enthält, dh das Wort sollte aus dem Einzelbitfehler (wie oben) wiederherstellbar sein. Nun, das ist pro Wort, so dass es möglicherweise bis zu 4-Bit-Fehler auf x4-Geräten (1 pro Wort) und bis zu 8-Bit-Fehler auf x8-Geräten (immer noch 1 pro Wort) durch Fehlerkorrektur jedes Wortes beheben kann.
Zusätzliche Fehler, mehr Bitfehler, totaler Speicherausfall, Kanalausfall, Busausfall usw. können immer noch schreckliche Probleme verursachen, aber aus diesem Grund haben Sie einen Cluster und ein Enterprise-DBMS.
Kurz gesagt, wenn Sie alles aktiviert haben und zu viele Bitfehler für Fehlerkorrekturalgorithmen zur Korrektur vorhanden sind, liegt immer noch ein Fehler vor, dh eine Fehlerabdeckungslücke. Diese können jedoch außergewöhnlich selten sein.