Was sind die häufigsten Ursachen für CPU-Ausfälle?


12

Was sind die häufigsten Ursachen für CPU-Ausfälle?

Gibt es Zwischenzustände zwischen einer perfekt funktionierenden und einer toten CPU?


1
Häufige Ursachen sind Hitze und falsche Spannungen. Stellen Sie also sicher, dass Ihr Computer ordnungsgemäß gekühlt ist und Sie über eine gute Stromversorgung und einen guten Stromschutz verfügen. Die Kühlung ist schlecht, wenn Ihre Computer zu staubig sind.
Zoredache

Antworten:


9

Möglicherweise muss nur ein Transistor ausfallen, bevor eine CPU nicht mehr funktioniert. Da eine moderne CPU Millionen von Transistoren enthält, fragen Sie sich möglicherweise, warum dies nicht häufiger vorkommt.

Und je nachdem, wo sich der Transistor in der CPU befindet, kann der Effekt unterschiedlich sein, aber ich glaube nicht, dass wir einen allmählichen Leistungsabfall erwarten können: Ein Fehler in der ALU wird möglicherweise erst bemerkt, wenn ein bestimmter Befehl ausgeführt wird, und Einige Anweisungen würden weniger häufig ausgeführt.

CPUS sterben also plötzlich ab, wenn ein Transistor ausfällt. Dies kann durch zu stark beanspruchte Defekte im Computerchip verursacht werden, sodass Zeit ein Faktor sein kann.

Übermäßige Hitze kann dazu führen, dass die winzigen Verunreinigungen im Silizium, die Transistoren bilden, diffundieren und die Betriebsparameter ändern. Wärme ist eine unvermeidbare Folge des einfachen Betriebs der Transistoren, so dass ein Mangel an Kühlung schließlich zu Ausfällen führen kann.

Andere Gründe könnten das Versagen von Verbindungen innerhalb des Gehäuses des CPU-Chips sein, aber Hersteller suchen immer nach verbesserten Verpackungsmethoden mit zuverlässigeren Verbindungen und besserer Wärmeableitung.


2
Hitze ist bei weitem der häufigste Weg. Und Sie würden nie wissen, dass es fehlschlägt, bis Sie zufällige Abstürze und Fehler bekommen. Die einzige Möglichkeit, dies wirklich zu erkennen, besteht darin, den Kernel zu debuggen. Wenn Ihre Anwendung über einfache Anweisungen und Speicherkopien abstürzt, ist dies ein totes Werbegeschenk. Entweder das oder du übertaktest zu stark :)
surfasb

Ich würde zufällige Abstürze und Fehler nicht als "Fehler" bezeichnen. Wenn das Problem mit der Kühlung verschwindet - großartig -, aber es klingt, als würde das Gerät außerhalb seiner Designspezifikationen betrieben.
Pavium

Mein Punkt ist, wenn Sie nicht in erster Linie übertakten, dann ist die Alternative, dass Ihre CPU ausfällt. Und ich weiß nichts über Sie, aber wenn mein Computer abstürzt, während die CPU eine Eins auf Null schaltet, würde ich das einen Fehler nennen. . .
Surfasb

Ja, ich war pedantisch. Im allgemeinen Gebrauch fällt der Computer aus, wenn er Vorgänge nicht zuverlässig ausführen kann. Ich sollte auch daran denken, dass Menschen, die von einer CPU sprechen, möglicherweise nicht den Chip im großen quadratischen Paket meinen. Ich würde , aber das ist eine professionelle Perspektive.
Pavium

Ja, das ist SuperUser. CPU! = CU.
Surfasb

3

Ehrlich gesagt gibt es keine häufigen Ursachen für CPU-Ausfälle ... zumindest im Vergleich zu anderen Teilen Ihrer Computer. Die CPU ist im Allgemeinen der zuverlässigste Teil eines Computers. Sie scheitern einfach nicht so oft.

Stattdessen sollten Sie darauf achten, dass Fehler auftreten, wenn es sich um bewegliche Teile handelt: herkömmliche Festplatten, optische Laufwerke und Lüfter. In jüngerer Zeit müssen wir dieser Liste auch SSDs hinzufügen, obwohl sie keine beweglichen Teile haben. Kondensatoren haben auch eine begrenzte Lebensdauer, so dass Netzteile und Motherboards, die beide Kondensatoren verwenden, verdächtig sein können. Manchmal hast du auch einen schlechten RAM-Stick, aber ich bin mir nie sicher, ob sie schlecht werden.

Und jetzt, endlich, nachdem wir uns fast alles andere in einem Computer angesehen haben, kommen wir zur CPU. Selbst wenn ein Fehler auftritt, liegt dies normalerweise daran, dass der Lüfter (wieder bewegliche Teile) zuerst defekt war und die CPU dadurch überhitzt wurde.


1

Unter den anderen hier genannten Ursachen kann auch eine unterbrochene interne Verbindung vorliegen. Es werden verschiedene Techniken verwendet, um die internen "Chip" -Leitungen mit den externen Gehäuseleitungen zu verbinden, und alle diese können einem möglichen Ausfall unterliegen.

Diese Art von Ausfall könnte möglicherweise das Ergebnis einer Überhitzung sein, und die Wahrscheinlichkeit des Ausfalls steigt mit "thermischen Zyklen", selbst wenn keine Überhitzung vorliegt. Der Fehler kann zeitweise auftreten (obwohl er normalerweise zu einem schweren Absturz führt, wenn er auftritt), wird jedoch mit dem Zyklus des Systems immer dauerhafter.

Diese Art von Fehler ahmt die Fehler nach, die bei schlechten Paket- / Socket-Verbindungen usw. auftreten.

[Hinzugefügt:] Und ich stelle fest, dass "Whisker" nicht erwähnt wurden. Ein großes Problem bei ICs und sehr kleinen gedruckten Schaltungen sind "Whisker" aus Metall, die aus der plattierten Verkabelung herauswachsen und zwischen benachbarten "Drähten" kurzschließen. Dies ist insbesondere dann ein Problem, wenn Sie das gesamte Blei herausnehmen (siehe "RoHS"), da den Drahtlegierungen üblicherweise Blei zugesetzt wird, um ein Whiskern zu verhindern. Dieses Problem verschlimmert sich natürlich mit zunehmender Temperatur.


1

Nach meiner Erfahrung Hitze. Wie warum? Zu viel Wärmeleitpaste! Viele (die meisten?) Menschen wissen, dass sie eine Wärmeleitpaste benötigen, aber sie wissen möglicherweise nicht, wie wenig sie verwenden sollten.

Die Regel ist, so viel wie die Größe eines ungekochten Reiskorns zu verwenden, ob Sie es glauben oder nicht.

Obwohl die Paste bei der Wärmeleitung etwa 10-mal besser ist als Luft, ist das Kupfer des Kühlkörpers 10-mal besser als die Paste, sodass Sie es so nah wie möglich an der CPU haben möchten. Die Paste ist wirklich nur zum Ausfüllen von SEHR WENIGEN Rissen, damit keine Luft drin ist.


0

Ein interessanter Artikel zum Thema »Transistor Aging« erschien im IEEE Spectrum Magazine ( http://spectrum.ieee.org/semiconductors/processors/transistor-aging ). Es werden verschiedene grundlegende Mechanismen aufgeführt, die zum Ausfall eines einzelnen Transistors führen können, wodurch die Rechenleistung des gesamten Chips auf die einer Kartoffel (oder eines Ziegels) reduziert werden kann.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.