Sie müssen das Modell und den Hersteller der CPUs in Ihrem Computer kennen. Sobald Sie das haben, können Sie auf der Website des Anbieters (oder vielleicht auf Wikipedia) die Taktrate, die Anzahl der Chips / Sockel, die Anzahl der Kerne pro Chip, die Anzahl der Gleitkommaoperationen pro Zyklus und die Vektorbreite dieser Operationen nachschlagen . Dann multiplizieren Sie einfach.
Nehmen wir zum Beispiel die Intel Xeon E5-2680 "Sandy Bridge" -Prozessoren in Stampede, wo ich arbeite. Die Spezifikationen sind:
- 2,7 GHz
- 2 Chips / Knoten, 8 Kerne / Chip
- 2 Vektoranweisungen / Zyklus
- 256 Bit breite AVX-Befehle (4 simultane Operanden mit doppelter Genauigkeit)
Multiplizieren dieser Werte ergibt 345,6 GF / Knoten oder 2,2 PF für den nicht beschleunigten Teil des Systems.
Wir denken normalerweise in 64-Bit-Operationen mit doppelter Genauigkeit, da dies die Genauigkeit ist, die für die große Mehrheit unserer Benutzer erforderlich ist. Sie können die Berechnung jedoch auch mit einfacher Genauigkeit wiederholen, wenn Sie möchten. Dies ändert normalerweise nur den letzten Faktor, z. B. 8 SP-Flops / Befehl anstelle von 4 DP-Flops / Befehl, kann sich jedoch stark davon unterscheiden. Ältere GPUs erreichten zum Beispiel nur eine DP von etwa 1/8 der SP-Rate. Wenn Sie jemals eine Zahl für Ihr System angeben, sollten Sie genau angeben, welche Zahl Sie verwendet haben, wenn dies nicht die doppelte Genauigkeit ist, da die Leute sonst davon ausgehen, dass dies der Fall ist.
Wenn Ihr Chip FMA-Befehle (Fused Multiply Add) unterstützt und diese mit voller Geschwindigkeit ausführen kann, werden diese von den meisten Benutzern als 2 Gleitkommaoperationen gezählt, obwohl ein Hardware-Leistungsindikator sie möglicherweise nur als einen Befehl zählt.
Schließlich können Sie dies auch für alle in Ihrem System möglicherweise vorhandenen Beschleuniger (z. B. eine GPU oder ein Xeon Phi) tun und diese Leistung zur CPU-Leistung hinzufügen, um eine theoretische Gesamtsumme zu erhalten.