Sobald ein Chip überhitzt, kann es zu Fehlfunktionen kommen. Beispielsweise können viele Programme fehlschlagen, wenn einige oder alle Teile eines Computers überhitzt sind.
Was genau passiert, dass Chips bei Überhitzung versagen?
Sobald ein Chip überhitzt, kann es zu Fehlfunktionen kommen. Beispielsweise können viele Programme fehlschlagen, wenn einige oder alle Teile eines Computers überhitzt sind.
Was genau passiert, dass Chips bei Überhitzung versagen?
Antworten:
Andere Antworten erweitern.
Es gibt noch mehr Gründe, aber diese machen ein paar wichtige aus.
Das Hauptproblem beim IC-Betrieb bei hohen Temperaturen ist der stark erhöhte Leckstrom einzelner Transistoren. Der Leckstrom kann so stark ansteigen, dass die Schaltspannungspegel der Geräte beeinträchtigt werden, sodass sich die Signale im Chip nicht ordnungsgemäß ausbreiten können und nicht mehr funktionieren. Sie erholen sich normalerweise, wenn man sie abkühlen lässt, aber das ist nicht immer der Fall.
Bei Herstellungsprozessen für den Hochtemperaturbetrieb (bis zu 300 ° C) wird die Silizium-auf-Isolator-CMOS-Technologie verwendet, da über einen sehr weiten Temperaturbereich nur geringe Leckströme auftreten.
Nur eine Ergänzung zu einigen ausgezeichneten Antworten: Technisch gesehen sind es nicht die Dotierstoffe, die mobiler werden, sondern eine Zunahme der intrinsischen Trägerkonzentration. Wenn irgendetwas die Dotierstoffe / Ladungsträger weniger beweglich werden, während das Siliziumkristallgitter aufgrund der zunehmenden Wärmeenergie zu "vibrieren" beginnt, was es für die Elektronen und Löcher schwieriger macht, durch die Vorrichtung zu fließen - optische Phononenstreuung Ich glaube, die Physiker nennen es das, aber ich kann es falsch liegen.
Wenn die intrinsische Ladungsträgerkonzentration über das Dotierungsniveau hinaus ansteigt, verlieren Sie die elektrische Kontrolle über das Gerät. Intrinsische Ladungsträger sind diejenigen, die vorhanden sind, bevor wir das Silizium dotieren. Die Idee von Halbleitern ist, dass wir unsere eigenen Ladungsträger hinzufügen, um pn-Übergänge zu erzeugen, und die anderen interessanten Dinge, die Transistoren tun. Silizium übersteigt eine Temperatur von etwa 150 Grad Celsius, daher ist die Wärmeableitung von Hochfrequenz- und Hochgeschwindigkeitsprozessoren sehr wichtig, da es in der Praxis nicht allzu schwierig ist, 150 Grad Celsius zu erreichen. Es besteht ein direkter Zusammenhang zwischen der intrinsischen Ladungsträgerkonzentration und dem Leckstrom eines Geräts.
Wie die anderen Jungs gezeigt haben, ist dies nur einer der Gründe, warum Chips versagen - es kann sogar zu etwas so Einfachem kommen, wie dass ein Drahtbond zu heiß wird und von seinem Pad abplatzt. Es gibt eine riesige Liste von Dingen.
Obwohl die Leckströme zunehmen, würde ich bei vielen MOS-basierten Geräten ein größeres Problem erwarten, dass die durch einen MOS-Transistor im "Ein" -Zustand fließende Strommenge abnimmt, wenn das Gerät heiß wird. Damit ein Gerät richtig funktioniert, muss ein Transistor, der einen Knoten schaltet, in der Lage sein, latente Kapazitäten in diesem Teil der Schaltung zu laden oder zu entladen, bevor irgendetwas anderes davon abhängt, dass dieser Knoten geschaltet wurde. Durch Verringern der Stromdurchlässigkeit von Transistoren wird die Rate verringert, mit der sie Knoten laden oder entladen können. Wenn ein Transistor nicht in der Lage ist, einen Knoten ausreichend zu laden oder zu entladen, bevor sich ein anderer Teil der Schaltung darauf verlässt, dass dieser Knoten geschaltet wurde, funktioniert die Schaltung nicht richtig.
Es ist zu beachten, dass bei NMOS-Bauelementen ein Design-Kompromiss bei der Dimensionierung passiver Pull-up-Transistoren auftrat. Je größer ein passiver Pull-up ist, desto schneller kann der Knoten von niedrig auf hoch umschalten. Je niedriger der Knoten ist, desto mehr Energie wird jedoch verschwendet. Viele dieser Geräte wurden daher in der Nähe der Betriebsgrenze betrieben, und hitzebedingte Funktionsstörungen waren (und sind für alte Elektronikgeräte nach wie vor) weit verbreitet. Bei gängiger CMOS-Elektronik sind solche Probleme im Allgemeinen weniger schwerwiegend. Ich habe keine Ahnung, inwieweit sie in Sachen Multi-GHZ-Prozessoren eine Rolle spielen.
Um die bestehenden Antworten zu ergänzen, reagieren die heutigen Schaltkreise empfindlich auf die folgenden zwei Alterungseffekte (nicht nur diese, sondern sie sind auch die wichtigsten bei Prozessen <150 nm):
Da die Temperatur die Mobilität der Träger erhöht, erhöht sie die HCI- und NBTI-Effekte, aber die Temperatur ist nicht die Hauptursache für NBTI und HCI:
Diese beiden Siliziumalterungseffekte verursachen sowohl reversible als auch irreversible Schäden an den Transistoren (durch Beeinträchtigung / Verschlechterung der Isolatorsubstrate), die die Transistorspannungsschwelle (Vt) erhöhen. Infolgedessen benötigt das Teil eine höhere Spannung, um das gleiche Leistungsniveau aufrechtzuerhalten, was eine Erhöhung der Betriebstemperatur impliziert, und wie an anderen Stellen erwähnt, wird eine erhöhte Transistor-Gate-Leckage folgen.
Zusammenfassend lässt sich sagen, dass die Temperatur das Alter des Teils nicht wirklich beschleunigt. Es sind höhere Frequenzen und Spannungen (dh Übertakten), die das Alter des Teils beschleunigen. Die Alterung der Transistoren erfordert jedoch eine höhere Betriebsspannung, wodurch sich das Teil stärker erwärmt.
Korolar: Die Folge des Übertaktens ist ein Anstieg der Temperatur und der erforderlichen Spannung.
Der allgemeine Grund für das irreversible Versagen von ICs liegt darin, dass das Aluminiummetall, das zum Herstellen von Verbindungen zwischen den verschiedenen Elementen verwendet wird, die Geräte schmilzt und öffnet oder kurzschließt.
Ja, Leckströme nehmen zu, aber im Allgemeinen ist es nicht der Leckstrom selbst, der ein Problem darstellt, sondern die dadurch verursachte Wärme und die daraus resultierende Beschädigung des Metalls im IC.
Stromkreise (z. B. Netzteile, Hochstromtreiber usw.) können beschädigt werden, da bei hohen Spannungen, wenn die Transistortreiber schnell abschalten, interne Ströme erzeugt werden, die ein Einrasten des Geräts verursachen, oder eine ungleichmäßige Stromverteilung im Inneren, die lokale Störungen verursacht Erwärmung und anschließender Metallbruch.
Eine große Anzahl (1000) von wiederholten thermischen Zyklen kann aufgrund von Fehlanpassungen zwischen der mechanischen Ausdehnung des IC und der Baugruppe zu einem Ausfall führen, was schließlich zum Abreißen von Bonddrähten oder zur Begrenzung des Kunststoffgehäusematerials und zu einem nachfolgenden mechanischen Ausfall führen kann.
Natürlich wird eine große Anzahl von IC-Parameterspezifikationen nur über einen bestimmten Temperaturbereich spezifiziert, und diese dürfen nicht außerhalb dieser Spezifikation liegen. Je nach Ausführung kann dies zu Fehlern oder inakzeptablen Parameterverschiebungen führen (während sich der IC außerhalb des Temperaturbereichs befindet) - dies kann bei extrem hohen oder niedrigen Temperaturen auftreten.