Eine Alternative zu vielen physischen Clusterknoten ist das Erstellen virtueller Maschinen. Sie hätten nur eine oder zwei tatsächliche physische Maschinen, könnten aber simulieren, dass viel mehr Knoten vorhanden sind. Dies würde gut funktionieren, um weniger Ressourcen (Platz, Leistung, $$$) zu erstellen, zu lernen und zu nutzen.
Dies würde Ihnen nicht viel von einer Kostenanalyse geben, aber es würde Ihnen den Einstieg erleichtern. Die Art der Cluster-Einrichtung hängt von der Art der Arbeit ab, die Sie dafür erstellen möchten. Sie können viele kleine Knoten oder nur ein paar leistungsfähige Knoten haben. Es gibt Umgebungen mit gemeinsamem und nicht gemeinsamem Speicher, die ebenfalls berücksichtigt werden müssen. Welche Art von parallelen Programmen möchten Sie erstellen? Je mehr physische Knoten Sie haben, desto mehr Platz, Energie, Kühlung und Netzwerkverbindung müssen Sie in Betracht ziehen. Manchmal ist nur ein einziger großer, massiver Computer der richtige Weg (und Shared-Memory-Umgebungen sind für IMHO einfacher zu programmieren).
Ich habe kürzlich angefangen, mit einem Cluster zu spielen, der ein paar zufällige P4-Boxen, Ubuntu und LAM-MPI baut. Es war definitiv eine Lernerfahrung.
Es waren tatsächlich ein paar P4-Laptops und Türme, die in einer Garage gestapelt waren. Es war ein Ghetto, aber ich wollte nur lernen. Ich habe gerade ein 100-Mbit / s-Ethernet-Netzwerk verwendet. Ich habe mich für Ubuntu entschieden, weil ich nicht viel mit der Hardware-Konfiguration der Boxen zu tun haben wollte. Ubuntu hatte viele der Treiber, die ich brauchte. Ich brauchte eine Linux-Umgebung, da die Anwendungen, die ich dafür schrieb, C-basierte Apps mit MPI-Schnittstellen waren. Ich habe versucht, das zu replizieren, was ich zuvor benutzt habe. Es war alles anders. Hardware, nichts Standard. Die meisten Cluster verfügen über genaue Hardware, sodass Sie Knoten im Handumdrehen hinzufügen und entfernen können.