Diese Antwort wurde bearbeitet, nachdem die Frage geklärt wurde.
Was sind andere Gründe, warum Wolken DAS bevorzugen?
Wobei "DAS" Direct Attached Storage bedeutet, dh SATA- oder SAS-Festplattenlaufwerke.
Alle Cloud-Anbieter verwenden DAS, da es Preis- / Leistungsverbesserungen um Größenordnungen bietet. Es handelt sich um eine horizontale Skalierung .
Kurz gesagt, SATA-Festplatten und SATA-Controller sind billige Waren. Sie sind Massenprodukte und sehr preisgünstig. Durch den Aufbau eines großen Clusters billiger PCs mit billigen SATA-Laufwerken erhalten Google, Amazon und andere eine enorme Kapazität zu einem sehr niedrigen Preis. Anschließend fügen sie ihre eigene Softwareschicht hinzu. Ihre Software führt eine Multi-Server-Replikation aus, um Leistung und Zuverlässigkeit zu gewährleisten, die Replikation nach einem Hardwarefehler zu überwachen, auszugleichen und andere Dinge.
Sie können sich MogileFS als einfacheren Vertreter der Art von Software ansehen , die Google, Amazon und andere für die Speicherung verwenden. Es ist natürlich eine andere Implementierung, aber es teilt viele der gleichen Entwurfsziele und -lösungen wie die großen Systeme. Wenn Sie möchten, finden Sie hier einen Ausgangspunkt, um mehr über GoogleFS zu erfahren .
Wie weiter unten in diesem Dokument erwähnt, sollten Clouds SAN oder NAS verwenden, da DAS nicht geeignet ist, wenn eine VM auf einen anderen Server verschoben wird
Es gibt zwei Gründe, warum SANs nicht verwendet werden.
1) Preis.
SANs sind im großen Maßstab enorm teuer. Obwohl sie die technisch "beste" Lösung sein mögen, werden sie aufgrund der Kosten normalerweise nicht in sehr großen Installationen verwendet.
2) Das CAP-Theorem Das CAP-Theorem von
Eric Brewer zeigt, dass Sie in sehr großem Maßstab keine starke Konsistenz aufrechterhalten können, während akzeptable Zuverlässigkeit, Fehlertoleranz und Leistung erhalten bleiben. SANs sind ein Versuch, eine starke Konsistenz der Hardware zu erreichen. Das mag für eine Installation mit 5.000 Servern gut funktionieren, aber es wurde nie nachgewiesen, dass es für die über 250.000 Server von Google funktioniert.
Ergebnis:
Bisher haben die Cloud-Computing-Anbieter beschlossen, die Komplexität der Aufrechterhaltung des Serverstatus auf den Anwendungsentwickler zu übertragen. Aktuelle Cloud-Angebote bieten nicht für jede virtuelle Maschine einen konsistenten Status. Anwendungsserver (virtuelle Maschinen) können abstürzen und ihre lokalen Daten können jederzeit verloren gehen.
Jeder Anbieter verfügt dann über eine eigene Implementierung von persistentem Speicher, den Sie für wichtige Daten verwenden sollen. Die Angebote von Amazon sind schöne Beispiele. MySQL , SimpleDB und Simple Storage Service . Diese Angebote selbst spiegeln den CAP-Satz wider - die MySQL-Instanz weist eine starke Konsistenz, aber eine begrenzte Skalierbarkeit auf. SimpleDB und S3 skalieren fantastisch, sind aber erst irgendwann konsistent.