Bei abnehmender Technologiegröße kann der Drahtwiderstand / die Kapazität nicht proportional zur Ausbreitungsverzögerung der jetzt schnelleren / kleineren Transistoren skalieren. Aus diesem Grund wird die Verzögerung weitgehend drahtdominiert (wenn die die Gates bildenden Transistoren schrumpfen, nehmen sowohl ihre Eingangskapazität als auch ihre Ausgangstreiberfähigkeiten ab).
Es gibt also einen Kompromiss zwischen einem schnelleren Transistor und den Treiberfähigkeiten desselben Transistors für eine gegebene Last. Wenn Sie bedenken, dass die größte Belastung für die meisten digitalen Gatter die Drahtkapazität und der ESD-Schutz in den folgenden Gattern ist, werden Sie feststellen, dass ein Punkt, an dem die Transistoren kleiner (schneller und schwächer) werden, die Verzögerung in situ nicht mehr verringert (weil die Last des Gates von Draht- und ESD-Widerstand / Kapazität der Drähte und ESD-Schutz zum nächsten Gate dominiert wird).
CPU's können dies abschwächen, da alles zusammen mit proportional dimensionierten Kabeln integriert ist. Trotzdem wird die Gate-Verzögerungsskalierung nicht mit der Interconnect-Verzögerungsskalierung abgeglichen. Die Drahtkapazität wird verringert, indem der Draht kleiner (kürzer und / oder dünner) und von benachbarten Leitern isoliert wird. Wenn der Draht dünner gemacht wird, erhöht sich nebenbei auch der Drahtwiderstand.
Sobald Sie nicht mehr auf dem Chip sind, werden die Drahtgrößen, die die einzelnen ICs verbinden, unerschwinglich groß (Dicke und Länge). Es hat keinen Sinn, einen IC zu bauen, der bei 2 GHz schaltet, wenn er praktisch nur 2 fF ansteuern kann. Es gibt keine Möglichkeit, die ICs miteinander zu verbinden, ohne die maximale Laufwerkkapazität zu überschreiten. Beispielsweise ist ein "langer" Draht in neueren Prozesstechnologien (7-22 nm) zwischen 10-100 um lang (und vielleicht 80 nm dick und 120 nm breit). Sie können dies nicht vernünftigerweise erreichen, egal wie intelligent Sie bei der Platzierung Ihrer einzelnen monolithischen ICs sind.
Und ich stimme auch Jonk zu, was ESD und Ausgabepufferung angeht.
Als ein numerisches Beispiel für die Ausgangspufferung wird ein NAND-Gatter mit praktischer aktueller Technologie betrachtet, das eine Verzögerung von 25 ps bei einer geeigneten Last und eine Eingangsanstiegsgeschwindigkeit von ~ 25 ps aufweist.
Ignorieren Sie die Verzögerung, um durch ESD-Pads / Schaltungen zu gehen. Dieses Tor kann nur ~ 2-3fF fahren. Um dies auf einen geeigneten Pegel am Ausgang zu puffern, benötigen Sie möglicherweise viele Pufferstufen.
Jede Stufe des Puffers hat eine Verzögerung von ca. 20 ps bei einem Fanout von 4. Sie können also feststellen, dass Sie den Vorteil schnellerer Gatter sehr schnell verlieren, wenn Sie die Ausgabe so stark puffern müssen.
Nehmen wir nur an, die Eingangskapazität über den ESD-Schutz + Draht (die Last, die jedes Gate ansteuern muss) liegt bei 130 fF, was wahrscheinlich sehr unterschätzt wird. Wenn Sie für jede Stufe einen Fanout von ~ 4 verwenden, benötigen Sie 2fF-> 8fF-> 16fF-> 32fF-> 128fF: 4 Pufferstufen.
Dies erhöht die NAND 25ps Verzögerung auf 105ps. Und es wird erwartet, dass der ESD-Schutz am nächsten Gate ebenfalls zu einer erheblichen Verzögerung führt.
Es besteht also ein Gleichgewicht zwischen "Verwenden des schnellstmöglichen Gatters und Puffern des Ausgangs" und "Verwenden eines langsameren Gatters, das von Natur aus (aufgrund größerer Transistoren) mehr Ausgangstreiber hat und daher weniger Stufen der Ausgangspufferung erfordert". Ich vermute, dass diese Verzögerung bei Allzweck-Logikgattern um 1 ns auftritt.
CPUs, die mit der Außenwelt verbunden sein müssen, erzielen eine höhere Rendite für ihre Pufferinvestitionen (und verfolgen daher immer noch immer kleinere Technologien), da sie diese Kosten nicht zwischen den einzelnen Gattern bezahlen, sondern an jedem E / A-Port einmal bezahlen.