Dies ist auf eine Kombination von Merkmalen moderner Prozessoren zurückzuführen.
Das erste, was zu einem hohen IPS beiträgt, ist die Tatsache, dass moderne Prozessoren mehrere Ausführungseinheiten haben, die unabhängig voneinander arbeiten können. In der folgenden Abbildung (von Wikipedia ausgeliehen: Intel Core Microarchitecture ) sehen Sie unten, dass acht Ausführungseinheiten (gelb dargestellt) Anweisungen gleichzeitig ausführen können. Nicht alle dieser Einheiten können dieselben Befehlstypen sichern, aber mindestens fünf von ihnen können eine ALU-Operation ausführen, und es gibt drei SSE-fähige Einheiten.
Kombiniert mit einer langen Anweisungs-Pipeline, die Anweisungen effizient stapeln kann, die für die Ausführung von Anweisungen durch diese Einheiten bereit sind ( falls erforderlich, außer Betrieb ), bedeutet dies, dass ein moderner Prozessor jederzeit eine große Anzahl von Anweisungen im laufenden Betrieb haben kann.
Die Ausführung jedes Befehls kann einige Taktzyklen in Anspruch nehmen. Wenn Sie die Ausführung jedoch effektiv parallelisieren können, können Sie IPS auf Kosten der Prozessorkomplexität und der thermischen Leistung massiv steigern.
Um diese großen Pipelines mit Anweisungen zu füllen, ist auch ein großer Cache erforderlich, der mit Anweisungen und Daten gefüllt werden kann. Dies trägt zur Größe des Chips und auch zur Wärmemenge bei, die der Prozessor erzeugt.
Der Grund, warum dies bei kleineren Prozessoren nicht der Fall ist, liegt darin, dass der Umfang der für die Prozessorkerne erforderlichen Steuerlogik sowie der Platzbedarf und die erzeugte Wärme erheblich erhöht werden. Wenn Sie einen kleinen, stromsparenden und schnell reagierenden Prozessor benötigen, benötigen Sie eine kurze Pipeline ohne zu viel "zusätzliches" Material, das die eigentlichen Funktionskerne umgibt. In der Regel minimieren sie den Cache, beschränken ihn auf nur einen der Einheitentypen, die für die Verarbeitung von Anweisungen erforderlich sind, und reduzieren die Komplexität jedes Teils.
Sie könnten einen kleinen Prozessor so komplex wie einen größeren Prozessor machen und eine ähnliche Leistung erzielen, aber dann würden sich die Anforderungen an Stromverbrauch und Kühlung exponentiell erhöhen.