Kleiner Distributed Computing-Cluster


13

Ich bin ein Gymnasiast, der versucht, einen Linux-Cluster für ein Projekt zu bauen (ich habe eine Reihe anständiger Computer, die diesen Sommer neu ins Leben gerufen werden sollen, also sagt die technische Abteilung im Grunde, solange ich sie nicht physisch kaputt mache, dass ich kann mach was auch immer.

Wie auch immer, ich weiß eigentlich nichts über den Aufbau eines Clusters, aber ich kann Linux ziemlich gut.

Ich muss folgende Dinge wissen: -Welche Distribution soll ich verwenden? Ist es überhaupt wichtig? -Welche Software kann den Cluster konfigurieren? -An Bord oder verteiltes FS? -Alle Websites, die anständige Anleitungen oder How-tos anbieten können?


Was wäre der Zweck des Clusters?
Frederik Deweerdt

Moderne Cluster werden für einen bestimmten Zweck erstellt. In der Regel für Web-App oder Datenspeicherung. Vielleicht kannst du LVS ausprobieren .
David S.

Wie andere geschrieben haben, impliziert "Cluster" häufig eine parallele Ausführung, die spezielle Codes oder Programmierung erfordert. Eine andere, aber coole Verwendung mehrerer Computer, die zusammenarbeiten, ist das Live-Failover gespiegelter Dateisysteme. Nehmen Sie sich eine Minute Zeit und werfen Sie einen Blick auf DRBD- und Cluster-Dateisysteme. Dies könnte Ihnen auch Anregungen geben: xenamo.sourceforge.net
pboin

Antworten:


6

Es hängt wirklich davon ab, was Sie erreichen möchten und was Sie unter "Distributed Computing Cluster" verstehen. Ich habe an der Uni einmal etwas Ähnliches mit alten Maschinen und PVM gemacht , das ist der "Cluster" im Sinne einer Gruppe von Maschinen, die als ein einziger Computer für die parallele Verarbeitung fungieren - denken Sie an Beowulf-Cluster. Natürlich benötigen Sie Code, der dafür geschrieben wurde.

Ein guter Anfang wäre, zu bestimmen, was Sie mit diesem Projekt lernen möchten. Ich empfehle Ihnen, zunächst den Wikipedia-Artikel über Paralleles Rechnen zu lesen und dann Ihre Anforderungen zu verfeinern, je nachdem, was Sie tun möchten.

Ein einfaches Warteschlangensystem (wie Gearman ) kann ausreichen, um schnell ein gutes Ergebnis zu erzielen .

Das Problem, das ich bei der Erstellung eines Parallel-Computing-Clusters hatte, war, dass ich nichts damit zu tun hatte. Es befand sich im Grunde genommen dort, aber es war ein unterhaltsames Projekt und ich lernte einiges. In jedem Fall werden Sie wahrscheinlich viel lernen und gleichzeitig Spaß haben, unabhängig davon, was Sie implementieren.

Was die Auswahl der Distributionen angeht, würde ich das wählen, mit dem ich mich am besten auskenne, da Sie wahrscheinlich Dinge aus dem Quellcode installieren müssen. Wenn Sie mit der Einrichtung vertraut sind, können Sie eine Distribution finden, die besser auf Ihre Bedürfnisse zugeschnitten ist. Aber jede Distribution sollte reichen.

Welche Software zur Konfiguration des Clusters? Dies hängt ganz davon ab, welchen Clustertyp Sie erstellen.

An Bord gegen verteiltes FS? Dies hängt wiederum von den Anforderungen für Ihren Cluster ab. Überträgt jeder Knoten Daten zwischen den anderen Knoten hin und her? Arbeiten sie als Sklaven mit einem einzigen Master? Werden sie völlig unabhängig operieren? Diese Fragen werden Ihre Auswahl beeinflussen. Und natürlich gibt es immer Kompromisse.

Einige andere Links, die sich als interessant erweisen könnten:

http://hadoop.apache.org/

http://www.csm.ornl.gov/oscar/

https://computing.llnl.gov/tutorials/parallel_comp/

http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/

http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/



-1

Testen Sie Linux HA (High Availability), eine frei verfügbare Linux-Cluster-Lösung, die auf mehreren Distributionen funktioniert.

Es ist wahrscheinlich nur eine von mehreren Lösungen. Ich weiß nicht, wie es mit anderen verglichen wird oder welche spezifischen Merkmale es hat. Ich weiß nur, dass einige Kollegen es für ernsthafte kommerzielle Software schwören.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.