Ich erwäge, ein RAID0-Setup für einen unserer SQL Server-Cluster zu verwenden. Ich werde die Situation skizzieren und nach dem Grund suchen, warum dies eine schlechte Idee sein kann. Auch wenn jemand, für den Sie Anwendungsfälle, Whitepapers oder andere Unterlagen haben, auf den Sie mich zu diesem Thema hinweisen können, wäre das großartig.
Wir haben 3 Server in 2 Rechenzentren, die Teil eines SQL-Clusters sind. Sie alle führen SQL Server in einer Verfügbarkeitsgruppe aus. Neben dem Primärserver befindet sich ein Replikat und im anderen Rechenzentrum ein weiteres. Sie führen eine synchrone Replikation mit automatischem Failover aus. Alle Laufwerke sind SSDs der Enterprise-Klasse. Sie werden SQL Server 2017 oder 2019 ausführen.
Ich denke, dass die Ausführung auf RAID0-Arrays gegenüber anderen Methoden mehrere Vorteile mit wenigen, wenn überhaupt wirklichen Nachteilen hätte. Der einzige Nachteil, den ich derzeit sehe, ist die mangelnde Redundanz auf dem Primärserver, sodass der Ausfall zunimmt. Als Profis:
Wenn ein Laufwerk ausfällt und nicht in einem verlangsamten, beeinträchtigten Zustand ausgeführt wird, bis jemand eine Benachrichtigung erhält und manuell darauf reagiert, kann der Server sofort eine sekundäre Funktion ausführen, die die volle Betriebsfähigkeit beibehält. Dies hat den zusätzlichen Vorteil, dass wir über ein Failover benachrichtigt werden, sodass wir die Ursache früher untersuchen können.
Dies verringert die Ausfallwahrscheinlichkeit insgesamt pro TB Kapazität. Da wir keine Paritäts- oder Spiegellaufwerke benötigen, reduzieren wir die Anzahl der Laufwerke pro Array. Mit weniger Laufwerken ist die Wahrscheinlichkeit eines Laufwerksausfalls insgesamt geringer.
Es ist günstiger. Weniger Laufwerke für unsere erforderliche Kapazität zu benötigen, kostet natürlich weniger.
Ich weiß, dass dies nicht das konventionelle Geschäftsdenken ist, aber gibt es etwas, über das ich nicht nachdenke? Ich würde jeden Input lieben, egal ob für oder gegen.
Ich versuche dies nicht, um die Abfrageleistung zu verbessern, aber wenn es sinnvolle gibt, können Sie sie gerne darauf hinweisen. Mein Hauptanliegen ist es, ein Problem mit der Zuverlässigkeit oder Redundanz, an das ich nicht gedacht habe, nicht zu berücksichtigen oder anzugehen.
Das Betriebssystem befindet sich auf einem separaten gespiegelten Laufwerk, sodass der Server selbst in Betrieb bleiben sollte. Eines dieser Laufwerke kann ersetzt und erneut gespiegelt werden. Es ist klein und enthält keine anderen Datenbankdateien als die System-DBs. Ich kann mir nicht vorstellen, dass es länger als Minuten dauert. Wenn eines der Daten-Arrays ausfällt, ersetzen wir das Laufwerk, erstellen das Array neu, stellen es wieder her und synchronisieren es erneut mit dem AG. Nach meiner persönlichen Erfahrung war die Wiederherstellung VIEL schneller als die Wiederherstellung eines RAID5-Laufwerks. Ich habe noch nie einen RAID1-Fehler gehabt, daher weiß ich nicht, ob dieser Neuaufbau schneller sein würde oder nicht. Die Wiederherstellungen würden aus einer Sicherung stammen und für die primäre Sicherung aktualisierend wiederhergestellt. Daher sollte die Auslastung des primären Servers nur minimal sein und nur die letzten Protokollminuten mit dem wiederhergestellten Replikat synchronisieren.