Viel zu allgemein
Der Transistor könnte sich in einem Abschnitt befinden, den Sie nicht verwenden, sodass Sie es nie erfahren werden.
Es könnte sich in einem Abschnitt befinden, den Sie verwenden, aber die Fehlerbedingung scheint immer noch zu funktionieren und benötigt dort immer nur eine Null. Sie ist auf Null fehlgeschlagen, und das ist in Ordnung. Ich habe es erst bemerkt, als möglicherweise ein Firmware-Upgrade durchgeführt wurde, bei dem dieser Transistor verwendet wurde anders.
Oder es könnte sich an einem Ort befinden, den Sie verwenden, und der Fehler kann zu einer beliebigen Anzahl möglicher Probleme führen, die sich auf vielfältige Weise zu manifestieren scheinen. Es ist hier sicherlich nicht möglich, zu expandieren, da wir nicht wissen, welchen Teil Sie verwenden und wie groß die fast nicht messbare Anzahl möglicher Ergebnisse ist, wenn ein Tropfen im Ozean die Anzahl der Hypothesen nicht abdeckt. Es lohnt sich nicht, allgemein darüber zu sprechen, auch nicht in der Luft- und Raumfahrt.
Für COTS- Systeme gibt es überhaupt nichts, was Sie schützen könnte. Möglicherweise haben Sie eine Software, die die dichten oder riskanten Dinge wie RAM abdeckt, eine Art POST- Speichertest. Aber wenn der ausgefallene Transistor so ist, wie Sie es im Prozessorkern vorschlagen, dann haben Sie einen Stein, der wieder in den Ozean fällt und nicht in der Lage ist, einen POST zu erstellen, der die Möglichkeiten abdeckt und richtig darüber berichtet, und der es nicht wert ist, überhaupt darüber zu sprechen es. Sie werfen das Ding und bekommen ein anderes. Wenn Sie Teile wie RAM mit höherem Risiko herstellen, befinden sich möglicherweise alternative Blöcke auf dem Chip, die mithilfe von BIST oder anderen Bildschirmtests zusammengeführt werden können. Ebenso sind einige Produkte von anderen Produkten abgeleitet, um auf den Tag eines 80486SX vs 80486DX zurückzugehen. Wenn die Gleitkommaeinheit während des Chipherstellungstests ausgefallen ist, blasen Sie die Sicherung (en) durch, um sie von einem potenziellen DX in einen SX umzuwandeln, und verkaufen sie auf diese Weise.
Der Chip-Bildschirm sucht und deckt mit Erfahrung mehr als 99,99% der Fehler ab. Je nach Produkt wird erwartet, dass es eines von Tausenden oder Zehntausenden gibt, die später versagen. So ist es eben.
Luft- und Raumfahrt, insbesondere strahlungsintensiv, Flip-Flops sind oder waren, als Sie noch Leute hatten, die wissen, wie man zuverlässige Sachen baut (sie sind jetzt größtenteils im Ruhestand), dreifach gewählt, drei Sätze Transistoren pro, wenn ein Bit ausfällt oder a Einzelereignis verärgert(was der Hauptgrund für die dreifache Abstimmung ist), dann dominieren die beiden anderen die Abstimmung. Sie könnten argumentieren, dass Sie das Was-wäre-wenn-eins-fehlgeschlagen-Argument erhalten. Aber Sie stimmen nicht dreifach ab, was nicht die kombinatorische Logik ist. Wenn es einen Treffer bekommt, sollte es sich beruhigen, bevor es in das nächste Flip Flop / Bit einrastet. Sie benötigen auch viel kräftigere Transistoren, um Störungen einzelner Ereignisse zu bewältigen, und Sie haben auch mehr anderes Material, um die Gesamtdosis zu bewältigen und die Lebensdauer des Teils zu verlängern, bevor das Ganze an der Exposition stirbt. Jahrzehntelange Erfahrung (alle verloren für die jungen Leute, die im verfügbaren Alter aufgewachsen sind, machen Weltraummüll, anstatt einen zu machen, der immer funktioniert). Ein Ausfall eines einzelnen Transistors ist kein Hauptanliegen, eine Störung durch ein einzelnes Ereignis und ein Latch-up sind (was zur Zerstörung führen könnte / würde, wenn es nicht gehandhabt wird) Gesamtdosis usw. Single Point of Failure zusammen mit MTBF sind sehr wichtig; Die MTBF sollte länger als die Missionslebensdauer sein, und kein einzelner Fehlerpunkt sollte ohne Erkennung und Lösung auskommen können. Zwei Fehler gleichzeitig sind normalerweise nicht lösbar (Tropfen auf den heißen Stein).
Mit COTS machen Sie sich keine Sorgen, dass ein einzelner Transistor ausfällt. Es dreht sich alles um Durchschnittswerte / Statistiken. Sie beginnen mit Erfahrung und es gibt sowieso nicht so viele Gießereien und sie wissen, was sie tun. Sie folgen der jahrzehntelangen Erfahrung in Design, Layout, Designverifizierung, Test usw. Und Sie erwarten definitiv eine Ausbeute von weniger als 100%, und dann erwarten Sie von den verpackten und gelieferten Teilen einen gewissen Prozentsatz derjenigen, die vor Ort versagen . Wenn Ihre Kunden COTS-Qualität und -Preise erwarten, aber fehlertolerante oder militärische oder Luft- und Raumfahrtteile, müssen Sie den Kunden lediglich darüber informieren, dass das, was sie verlangen, eine um eine Größenordnung höhere Preise und eine um eine Größenordnung langsamere Bandbreite ist. Rechenleistung. Sowie eine um eine Größenordnung längere Vorlaufzeit.
Der RAM, der dicht ist, ist ein Bereich, der sich auf viel konzentriert, nicht für einen einzelnen Transistorausfall, sondern eher für eine einzelne Ereignisstörung, ein Bit umgedreht. Daher werden ECC / EDAC verwendet, wie in der Fertigung erwähnt, kann es eine BIST und eine alternative Bank geben, die zusammengeschmolzen werden können. Bei Dingen wie Flash und / oder Festplatten sind sie fehleranfällig, sodass es außerhalb der Sicht des Benutzers möglicherweise zusätzliche gibt Banken / Sektoren, die als schlecht markiert und andere ausgetauscht werden können. Dies ist mit RAM möglich, aber normalerweise nicht, da Sie RAM nicht so verwenden, wie Sie nichtflüchtigen Speicher verwenden, sondern DIMMsZum Beispiel, und lassen Sie den Benutzer sie ersetzen, wenn sie fehlschlagen. Normalerweise wie der Prozessorsockel, der für Upgrades oder Konfigurationsoptionen vorgesehen ist, nicht weil der Arbeitsspeicher im Vergleich zu anderen Komponenten auf der Platine mit hoher Geschwindigkeit ausfällt.