Es hängt wirklich davon ab, was Sie erreichen möchten und was Sie unter "Distributed Computing Cluster" verstehen. Ich habe an der Uni einmal etwas Ähnliches mit alten Maschinen und PVM gemacht , das ist der "Cluster" im Sinne einer Gruppe von Maschinen, die als ein einziger Computer für die parallele Verarbeitung fungieren - denken Sie an Beowulf-Cluster. Natürlich benötigen Sie Code, der dafür geschrieben wurde.
Ein guter Anfang wäre, zu bestimmen, was Sie mit diesem Projekt lernen möchten. Ich empfehle Ihnen, zunächst den Wikipedia-Artikel über Paralleles Rechnen zu lesen und dann Ihre Anforderungen zu verfeinern, je nachdem, was Sie tun möchten.
Ein einfaches Warteschlangensystem (wie Gearman ) kann ausreichen, um schnell ein gutes Ergebnis zu erzielen .
Das Problem, das ich bei der Erstellung eines Parallel-Computing-Clusters hatte, war, dass ich nichts damit zu tun hatte. Es befand sich im Grunde genommen dort, aber es war ein unterhaltsames Projekt und ich lernte einiges. In jedem Fall werden Sie wahrscheinlich viel lernen und gleichzeitig Spaß haben, unabhängig davon, was Sie implementieren.
Was die Auswahl der Distributionen angeht, würde ich das wählen, mit dem ich mich am besten auskenne, da Sie wahrscheinlich Dinge aus dem Quellcode installieren müssen. Wenn Sie mit der Einrichtung vertraut sind, können Sie eine Distribution finden, die besser auf Ihre Bedürfnisse zugeschnitten ist. Aber jede Distribution sollte reichen.
Welche Software zur Konfiguration des Clusters? Dies hängt ganz davon ab, welchen Clustertyp Sie erstellen.
An Bord gegen verteiltes FS? Dies hängt wiederum von den Anforderungen für Ihren Cluster ab. Überträgt jeder Knoten Daten zwischen den anderen Knoten hin und her? Arbeiten sie als Sklaven mit einem einzigen Master? Werden sie völlig unabhängig operieren? Diese Fragen werden Ihre Auswahl beeinflussen. Und natürlich gibt es immer Kompromisse.
Einige andere Links, die sich als interessant erweisen könnten:
http://hadoop.apache.org/
http://www.csm.ornl.gov/oscar/
https://computing.llnl.gov/tutorials/parallel_comp/
http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/
http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/