Ich muss eine Lösung erstellen, um interne Git-Repositorys zu hosten. Es muss Hunderttausende (oder mehr) Repositorys unterstützen.
Ich plane, mehrere "dumme" Server mit einem gemeinsam genutzten Speicher zu verwenden. Wenn also ein Client versucht, auf ein Repository zuzugreifen, wird dieser vom Load-Balancer auf einen der verfügbaren Server umgeleitet. Jede Änderung am Repository wird auf allen Knoten repliziert.
Mein erster Gedanke war, GlusterFS dafür zu verwenden, aber ich habe gelesen, dass es mit kleinen Dateien nicht gut funktioniert. Ich denke auch daran, alles selbst mit DRBD zu replizieren, aber dies erfordert mehr Setup und scheint im Vergleich zu GlusterFS komplizierter zu sein.
Welcher der beiden bietet bessere Leistungen? Grundsätzlich ist das Problem, das ich zu lösen versuche, dass ich möchte, dass andere die Daten weiterhin bereitstellen können, wenn einer der Server ausfällt.