Wie kann man die Ausfallwahrscheinlichkeit ermitteln, wenn keine Fehler aufgetreten sind?


50

Ich habe mich gefragt, ob es eine Möglichkeit gibt, die Wahrscheinlichkeit eines Ausfalls (eines Produkts) zu ermitteln, wenn wir 1 Jahr lang 100.000 Produkte auf dem Markt haben und keine Ausfälle haben. Wie hoch ist die Wahrscheinlichkeit, dass eines der nächsten 10.000 verkauften Produkte versagt?


4
Etwas sagt mir, dass dies nicht das eigentliche Zuverlässigkeitsproblem ist. Es gibt keine Produkte mit so niedrigen Ausfallraten.
Aksakal

Sie benötigen ein Modell für die Verteilung möglicher Erfolgs- / Misserfolgsraten, bevor Sie aus der Statistik auf die Wahrscheinlichkeiten für tatsächliche Erfolgs- / Misserfolgsraten schließen können. Ihre Beschreibung gibt nur sehr wenig Anhaltspunkte, um auf eine solche Verteilung schließen zu können.
RBarryYoung

1
@RBarryYoung überprüfen Sie bitte die angegebenen Antworten - sie bieten einige interessante und gültige Ansätze für das Problem. Wenn Sie mit diesen Ansätzen nicht einverstanden sind, können Sie sie gerne kommentieren oder Ihre eigene Antwort geben.
Tim

2
@Aksakal - Eine so niedrige Ausfallrate scheint nicht unmöglich zu sein, wenn es sich um ein einfaches Produkt mit hohem Wert und einem so hohen Risiko im Falle eines Ausfalls (wie bei einem chirurgischen Instrument) handelt, dass es Tests und Inspektionen (und möglicherweise unabhängig) durchläuft Zertifizierung) vor der Freigabe. Natürlich könnte das Gegenteil der Fall sein, das Produkt könnte einen so niedrigen Wert haben, dass Endbenutzer keine Probleme mit fehlerhaften Produkten melden (sicherlich haben Kaugummihersteller eine gemeldete Fehlerquote von weniger als 1/100000?), Der Verbraucher wirft es einfach weg es und versucht einen neuen.
Johnny

@ Johnny, als Motorola mit Markt kam, rühmten sie sich, dass es 3 Fehler pro 100 Millionen Produkte gibt, oder so ähnlich. 6σ
Aksakal,

Antworten:


43

Die Wahrscheinlichkeit, dass ein Produkt ausfällt, ist sicherlich eine Funktion der Zeit und des Gebrauchs. Wir haben keine Daten zur Nutzung und mit nur einem Jahr gibt es keine Ausfälle (Glückwunsch!). Daher kann dieser Aspekt ( Überlebensfunktion genannt ) anhand Ihrer Daten nicht geschätzt werden.

Sie können sich jedoch Fehler innerhalb eines Jahres vorstellen, die sich aus einer Binomialverteilung ergeben . Sie haben immer noch keine Fehler, aber dies ist jetzt ein häufiges Problem. Eine einfache Lösung ist die Verwendung der Regel 3 , die mit großem genau ist N(was Sie sicherlich haben). Insbesondere können Sie die Obergrenze eines einseitigen 95% -Konfidenzintervalls (dh die Untergrenze ist 0 ) für die wahre Ausfallwahrscheinlichkeit innerhalb eines Jahres als 3/N . In Ihrem Fall sind Sie zu 95% davon überzeugt, dass die Rate unter 0.00003 .

Sie haben auch gefragt, wie die Wahrscheinlichkeit berechnet werden soll, dass einer oder mehrere der nächsten 10 KB fehlschlagen. Ein schneller und einfacher (wenn auch extremer) Weg, um die obige Analyse zu erweitern, besteht darin, nur die Obergrenze als zugrunde liegende Wahrscheinlichkeit zu verwenden und die entsprechende binomische CDF zu verwenden, um die Wahrscheinlichkeit zu ermitteln, dass es keine 0 Fehler geben wird. Mit RCode könnten wir Folgendes tun 1-pbinom(0, size=10000, prob=0.00003):, wodurch die 0.2591851Wahrscheinlichkeit besteht, dass in den nächsten 10.000 Produkten ein oder mehrere Fehler auftreten. Wenn Sie die obere Grenze verwendet haben, ist dies nicht die optimale Punktschätzung für die Wahrscheinlichkeit mindestens eines Ausfalls. Sie können vielmehr sagen, dass es sehr unwahrscheinlich ist, dass die Wahrscheinlichkeit eines Ausfalls 1 mehr als 26 % beträgt.26%(Erkennen, dass dies eine etwas "handgewellte" Rahmung ist). Eine andere Möglichkeit besteht darin, @ amoebas Vorschlag der Schätzung aus Laplace's Nachfolgeregel zu verwenden . Die Nachfolgeregel besagt, dass die geschätzte Ausfallwahrscheinlichkeit (F+1)/(N+2) , wobei F die Anzahl der Ausfälle ist. In diesem Fall p = 9,9998 × 10 - 06 , und die Berechnung für die vorhergesagte Wahrscheinlichkeit von 1 + Fehlern in den nächsten 10.000 sind , wodurch man , oderp^=9.9998×10061+1-pbinom(0, size=10000, prob=9.9998e-06)0.0951612210% .


3
+1. Ich habe noch nie von der "Regel 3" gehört. Ich frage mich, ob es einen Zusammenhang zwischen der Regel 3 und der "Laplace-Regel der Nachfolge" gibt. Nach letzterem kann (wenn ich es richtig anwende) die Ausfallwahrscheinlichkeit mit geschätzt werden 1/(N+2).
Amöbe sagt Reinstate Monica

14
@amoeba Diese Regel von 3 ist ein einseitiges Vertrauenslimit von 95%. Angenommen, die Fehleranzahl hat eine Binomialverteilung . Dann ist die Wahrscheinlichkeit, keine Fehler zu sehen, ( 1 - p ) n . Um dies größer als 5 % zu machen , lösen Sie ( 1 - p ) n0,05 für p . Unter Verwendung von log ( 1 - p ) - p für kleines p ist die Lösung p - log(n,p)(1p)n5%(1p)n0.05plog(1p)pp . Da 0,05 = 1 / 20 e 3 , erhalten wir p 3 / n . Das ist die "Regel von 3". Es lohnt sich zu wissen, da Sie jetzt wissen, wie Sie die "3" variieren können, wenn Sie das Konfidenzniveau anpassen möchten, und Sie können es auch invertieren, um das Minimum n zu finden, daszum Erfassen einer Rate von p oder mehrerforderlich ist. plog(0.05)/n0.05=1/20e3p3/nnp
whuber

1
@amoeba Wie ich schon sagte, habe ich vorher eine Uniform über die Ausfallwahrscheinlichkeit genommen. Ich glaube, dass ein anderer Prior zu erheblich anderen Ergebnissen geführt hätte.
Yair Daon

1
Deine Bearbeitung ist ein guter Fortschritt (+1). Es wirft jedoch Fragen der Auslegung auf. Wir sind uns nicht "sicher", dass die Chance nicht mehr als beträgt, da wir uns der wahren zugrunde liegenden Chance nicht ganz sicher sind. Wir haben keine "Obergrenze" aufp26%p , sondern nur eine obere Vertrauensgrenze. Wenn Sie eine Vorhersage für ein zukünftiges Ereignis abgeben, müssen Sie (a) diese abschätzen und (b) Grenzen setzen. Betrachten Sie es wie folgt: Geben Sie uns Grenzen für wenn X Binomial ( n , p ) , Y Binomial ( m , p ) unabhängig von X istYXBinomial(n,p)YBinomial(m,p) . Diese Grenzen sind einVorhersageintervallfür Y auf Basis von X . X=0YX
whuber

2
Ja für die "Dreierregel". Ich Faust es vor zu dem „Journal of the American Medical Association“ in einer kurzen Notiz viele Jahre sehe jama.jamanetwork.com/article.aspx?articleid=385438
Dwin

25

Sie können einen bayesianischen Ansatz wählen. bezeichne die Wahrscheinlichkeit des Scheiterns mit und stelle es dir als Zufallsvariable vor. A priori, bevor Sie die Ergebnisse der Experimente zu sehen, könnte glauben, dass Θ ~ U ( 0 , 1 ) . Wenn Sie die Ingenieure vertrauen dieses Produkt zuverlässig machen, vielleicht können Sie nehmen Θ ~ U ( 0 , 0,1 ) oder so. Es liegt an dir. Dann können Sie den Bayes-Satz verwenden, um die hintere Verteilung von θ zu berechnen . Bezeichnen Sie A als das Ereignis, das Sie beobachtet haben ( n Experimente mit null Fehlern).ΘΘU(0,1)ΘU(0,0.1)θAn

Alles ist einfach:Θist gleichförmig, also istp(θ)eine Konstante. Da SienExperimente durchführen, istp(A|θ)nur die Wahrscheinlichkeit für keineFehlerinnBernouli-Versuchen mit der Wahrscheinlichkeit für einen Fehlerθ.

p(Θ=θ|A)=p(A|Θ=θ)p(Θ=θ)p(A)=p(A|θ)p(θ)p(A|θ)p(θ)dθ.
Θp(θ)np(A|θ)nθ

Sobald Sie Sie Gold: Sie können die Wahrscheinlichkeit jedes Ereignisses B durch Integration berechnen : P ( B ) = p ( B | θ ) p ( θ | A ) d θp(θ|A)BP(B)=p(B|θ)p(θ|A)dθ

Im Folgenden erarbeite ich eine detaillierte Lösung, die dem obigen Ansatz folgt. Ich nehme ein paar Standardverknüpfungen.

Sei der Prior . Dann gilt: p ( θ | A ) p ( A | θ ) 1 = ( 1 - θ ) n . Die Normierungskonstante P ( A ) = P ( A | θ ) p ( θ ) d θ gefunden wird , werden B ( 1 , nU(0,1)

p(θ|A)p(A|θ)1=(1θ)n.
p(A)=p(A|θ)p(θ)dθ - siehe Wikipedia-SeitenBetafunktionundBetaverteilung. Also ist p ( θ | A ) = ( 1 - θ ) nB(1,n+1) ist eine Beta-Verteilung mit den Parametern1,n+1.p(θ|A)=(1θ)nB(1,n+1)1,n+1

Man bezeichne die Wahrscheinlichkeit ohne Ausfälle in Produkten im nächsten Jahr von B . Die Wahrscheinlichkeit mindestens eines Ausfalls beträgt 1 - P ( B ) . Dann ist 1 - P ( B ) = 1 - ( 1 - θ ) m ( 1 - θ ) nmB1P(B)

1P(B)=1(1θ)m(1θ)nB(1,n+1)dθ=B(1,n+m+1)B(1,n+1)

das ist etwa , unter Verwendung von n = 100 , 000 , m = 10 , 000 . Nicht sehr beeindruckend? Ich habe eine einheitliche Verteilung der Ausfallwahrscheinlichkeit vorgenommen. Vielleicht haben Sie besseres Vertrauen in Ihre Ingenieure.0.1n=100,000,m=10,000


3
Es scheint seltsam, für ein so einfaches Problem so wenig eine tatsächliche Lösung zu finden, besonders wenn die Methode so vielversprechend aussieht. Schlagen Sie vor, dass die Berechnungen schwierig sind?
whuber

2
@whuber ich habe es nicht vergessen, ich dachte, dieser letzte Schritt ist offensichtlich. Was ich mit "unauffällig" gemeint habe, ist, dass die Wahrscheinlichkeit eines Ausfalls von 10% immer noch groß ist, verglichen mit dem Fehlen von Ausfällen in den ersten 100.000 Läufen. Auch danke für den Kommentar zu konjugierten Paaren, ich dachte, es könnte das OP verwirren und sie von dem ablenken, was wichtig ist, weshalb es weggelassen wird.
Yair Daon

3
Natürlich, ja - aber wenn Sie am Ende einen Wert von 0,9 haben, sehen die Leute diese Zahl, fast unabhängig davon, was Sie im vorhergehenden Text darüber sagen. Damit Sie nicht missverstanden werden, ist es immer hilfreich, genau anzugeben, welche Antwort Sie anbieten. (+1 für die verbesserte Antwort,
Übrigens

3
Ungeachtet Ihres Vertrauens in Ihre Ingenieure ist es in der Tat nicht wirklich überraschend, dass Sie, wenn Sie Versuche ohne Fehler beobachten, im Durchschnitt mit k Fehlern innerhalb der nächsten k n Versuche rechnen sollten und daher mindestens einen erwarten sollten Versagen mit der Wahrscheinlichkeit 1 - e - k , was ungefähr k für kleines k ist . Somit ergeben 100.000 erfolgreiche Versuche eine zu erwartende Wahrscheinlichkeit von ungefähr 10%, dass mindestens ein Versuch innerhalb der nächsten 10.000 Versuche fehlschlägt. n1kkn1ekkk
Ilmari Karonen

2
@whuber Deine Annahme, dass der Prior keine Rolle spielt, ist im Fall von Null-Fehlern nicht wahr. Es hängt stark von der Steigung nahe Null ab, zum Beispiel geben die flache Uniform vor (Beta 1,1) und Jeffreys vor (Beta 0,5, 0,5) einen wesentlich anderen posterioren Wert.
Erik

12

Warum nicht vorhersagen, wie viele Produkte ausfallen könnten, anstatt eine Wahrscheinlichkeit zu berechnen ?

Modellierung der Beobachtungen

Es gibt Produkte auf dem Gebiet und ein weiteres m = 10000, das in Betracht gezogen wird. Angenommen, ihre Fehler sind alle unabhängig und konstant mit der Wahrscheinlichkeit p .n=100000m=10000p

Wir können diese Situation mit Hilfe eines Binomial Experiment Modell: aus einer Box von Tickets mit einem unbekannten Anteil von „Versagen“ Tickets und 1 - p „Erfolg“ Tickets, zeichnen m + n = 110000 Tickets (mit Ersatz, so dass die Ausfallwahrscheinlichkeit bleibt gleich). Zählen Sie die Fehler unter den ersten n Tickets - sei dies X - und zählen Sie die Fehler unter den verbleibenden m Tickets, wobei Sie das Y nennen .p1pm+n=110000nXmY

Die Frage formulieren

Im Prinzip können und 0 Y m alles sein. Was uns interessiert, ist die Chance, dass Y = u gegeben ist, dass X + Y = u (mit u einer beliebigen Zahl in { 0 , 1 , , m } ). Da die Fehler unter allen n + m Tickets überall auftreten können, wobei jede mögliche Konfiguration die gleiche Chance hat, wird dies durch Teilen der Anzahl von u ermittelt0Xn0YmY=u X+Y=uu{0,1,,m}n+mu-Untergruppen von Dingen nach der Anzahl von u -Untergruppen von allen n + m Dingen:mun+m

p(u;n,m)=Pr(Y=u|X+Y=u)=(mu)(n+mu)=m(m1)(mu+1)(n+m)(n+m1)(n+mu+1).

Vergleichbare Formeln können für die Berechnung verwendet werden, wenn X=1,2,.

Eine obere - Vorhersagegrenze1α (UPL) für die Anzahl von Fehlern in den letzten Tickets, t α ( X ; n , m ) wird von der kleinsten gegeben u ( in Abhängigkeit von X ) , für die p ( u ; n , m ) α .mtα(X;n,m)uXp(u;n,m)α

Interpretation

Die UPL sollte im Hinblick auf das Risiko der Verwendung von interpretiert werden , wie es bewertet wird, bevor entweder X oder Y beobachtet werden. Mit anderen Worten: Angenommen, es ist ein Jahr her und Sie werden gebeten, ein Verfahren zur Vorhersage der Anzahl der Fehler in den nächsten m Produkten zu empfehlen , sobald die ersten n beobachtet wurden. Ihr Kunde fragttαXYmn

Wie groß ist die Wahrscheinlichkeit, dass Ihr Eingriff unterbewertet ? Ich meine nicht in der Zukunft, nachdem Sie mehr Daten haben; Ich meine jetzt, weil ich jetzt Entscheidungen treffen muss und die einzigen Chancen, die mir zur Verfügung stehen, die sind, die in diesem Moment berechnet werden können. "Y

Ihre Antwort kann sein,

Im Moment ist die Chance nicht größer als , aber wenn Sie eine kleinere Vorhersage verwenden möchten, wird die Chance α überschreiten .αα

Ergebnisse

Für , m = 10 4 und X = 0 können wir das berechnenn=105m=104X=0

p(0,n,m)=1; p(1,n,m)=1110.091; p(2,n,m)=9091099990.0083;

Daher auf beobachtet haben X=0 ,

  • Bis zu Konfidenz (das heißt, wenn 9,1 % α ), vorherzusagen , ist es höchstens t α ( 0 ; n , m ) = 1 Fehler in den nächsten 10 , 000 Produkten.1α=90.9%9.1%αtα(0;n,m)=110,000

  • Bis zu Konfidenz (das heißt, wenn 0,8 % α < 9,1 % ) vorherzusagen , gibt es höchstens t α ( 0 ; n , m ) = 2 Fehler in den nächsten 10 , 000 Produkten.99.2%0.8%α<9.1%tα(0;n,m)=210,000

  • Usw.


Bemerkungen

Wann und warum sollte dieser Ansatz angewendet werden? Angenommen, Ihr Unternehmen stellt viele verschiedene Produkte her. Nach der Beobachtung der Leistung von von jedem im Feld, mag es Garantien zu produzieren, wie "komplette kostenlose Ersetzung von Fehlern innerhalb eines Jahres." Durch Vorhersagegrenzen für die Anzahl der Ausfälle können Sie die Gesamtkosten für die Absicherung dieser Garantien steuern. Da Sie viele Produkte herstellen und erwarten, dass Fehler auf zufällige Umstände zurückzuführen sind, auf die Sie keinen Einfluss haben, ist die Erfahrung jedes Produkts unabhängig. Es ist sinnvoll, Ihr Risiko langfristig zu kontrollierenn. Hin und wieder müssen Sie möglicherweise mehr Ansprüche als erwartet bezahlen, aber die meiste Zeit zahlen Sie weniger. Wenn das Zahlen von mehr als angekündigt ruinös sein könnte, setzen Sie auf extrem klein (und Sie würden wahrscheinlich auch ein ausgefeilteres Fehlermodell verwenden!). Ansonsten, wenn die Kosten gering sind, können Sie mit geringem Vertrauen leben (hohes α ). Diese Berechnungen zeigen, wie man Vertrauen und Risiken in Einklang bringt.αα

Beachten Sie, dass wir nicht die vollständige Prozedur berechnen müssen . Wir warten, bis X beobachtet wird, und führen dann einfach die oben gezeigten Berechnungen für dieses bestimmte X (hier X = 0 ) durch. Grundsätzlich hätten wir aber zu Beginn die Berechnungen für alle möglichen Werte von X durchführen können .tXXX=0X

Ein Bayes'scher Ansatz (beschrieben in anderen Antworten) ist attraktiv und funktioniert gut, vorausgesetzt, die Ergebnisse hängen nicht stark vom vorherigen ab. Wenn die Fehlerrate so niedrig ist, dass nur sehr wenige (oder keine) Fehler beobachtet werden, sind die Ergebnisse leider von der Wahl des Prior abhängig.


+1, aber scheint nicht korrekt zu sein. p(0,n,m)=1
Amöbe sagt Reinstate Monica

1
@COOLSerdash, weil und die Terme für u = 1 , 2 ... ungleich Null sind. up(u,n,m)=1u=1,2...
Amöbe sagt Reinstate Monica

1
Der Grund, warum Sie , wie @amoeba feststellt, erhalten, ist, dass Ihr p ( u ; n , m ) = ( mup(u;n,m)>1p(u;n,m)=(mu)(n+mu) ist nicht wirklich , sondern P r ( Y = u | X + Y = u ) = P r ( X = 0 | X + Y = u ) (und soll also wirklich zB als p ( 0 ; n , m , u ) bezeichnet werdenPr(Y=u|X=0)Pr(Y=u|X+Y=u) = Pr(X=0|X+Y=u)p(0;n,m,u)oder etwas ähnliches). Ich habe später einige Probleme damit, genau zu verfolgen, was Sie damit machen, aber ich bin mir ziemlich sicher, dass es unglücklicherweise keine richtige Lösung für das gestellte Problem ist.
Ilmari Karonen

1
@IlmariKaronen Vielen Dank für Ihre Kommentare. Sie haben Recht, dass ich etwas deutlicher hätte charakterisieren sollen , weil es sich nicht um eine Wahrscheinlichkeitsverteilung über u handelt - es ist eine bedingte Wahrscheinlichkeit -, aber ich glaube, die Antwort selbst ist trotzdem richtig und ich Ich bin sehr zuversichtlich, dass dieser Ansatz zur Berechnung von Vorhersagegrenzen sowohl richtig als auch konventionell ist. Ich werde diesen Beitrag bearbeiten, um diese Punkte zu klären. p(u;n,m)u
whuber

1
@Ilmari Ich habe die Bearbeitung bereits vorgenommen - Sie können sie im Bearbeitungsverlauf sehen. Ich nehme keine Prioritäten an und wende nur die Definition eines Vorhersageintervalls auf dieses Problem an. Wenn Sie herausfordern möchten, ob dies "statistisch bedeutsam" ist, werden Sie feststellen, dass Sie dieses Standardkonstrukt quixotisch herausfordern. Siehe zum Beispiel Hahn & Meeker, Statistical Intervals (J. Wiley 1991).
whuber

9

Das Folgende ist eine Bayes'sche Antwort auf "Wie viele von 10.000 neuen Produkten werden voraussichtlich scheitern, wenn nicht alle zuvor produzierten 100.000 versagen?", Aber Sie sollten die Sensibilität für verschiedene Prioritäten berücksichtigen.

Angenommen, sind bedingt unabhängig und identisch verteilt, da Θ = θ , derartdass X 1 | Θ = θ ~ B e r n o u l l i ( θ ) , und verwendet das Konjugat vor Θ ~ B e t a ( a , b ) mit a , b > 0 .X1,,XnΘ=θX1Θ=θBernoulli(θ)ΘBeta(a,b)a,b>0

Für , haben wir E [ n Σ i = m + 1 X im<n

E[i=m+1nXi|X1=0,Xm=0]=i=m+1nE[XiX1=0,Xm=0].

Für , haben wir E [ X i | X 1 = 0 , ... X m = 0 ]m+1in In dem wir verwenden& THgr;|X1=0,...,Xm=0~Beta(a,m+b).

E[XiX1=0,Xm=0]=Pr(Xi=1X1=0,Xm=0)=01Pr(Xi=1Θ=θ)fΘX1,,Xm(θ0,,0)dθ=Γ(m+a+b)Γ(m+a+b+1)Γ(a+1)Γ(a)=am+a+b,
ΘX1=0,,Xm=0Beta(a,m+b)

Anstecken Ihre Zahlen, mit einer Uniform vor ( ) Sie einen Ausfallrate erwarten rund 10 % , während ein Jeffreys artig vor ( a = 1 / 2 , b = 1 / 2 ) gibt Ihnen einen Ausfall Rate in der Nähe von 5 % .a=1,b=110%a=1/2,b=1/25%

i=m+1nXi|Θ=θBin(nm+2,θ),
Pr(i=m+1nXi=t|X1=0,Xm=0)=(nm+2t)Γ(m+a+b)Γ(a)Γ(m+b)Γ(t+a)Γ(nt+2)Γ(n+a+2),
t=0,1,,nm+2

95%


3
mBeta(a,b) ist ungefähr proportional zua, aber fast unabhängig vonb. In ähnlicher Weise ist es für einen einheitlichen Prior nicht wirklich wichtig, ob der PriorU(0,1)oder istam+a+bamabU(0,1)U(0,0.01)U(0.01,1)

6

Mit Laplace's Sunrise-Problem- Ansatz erhalten wir die Wahrscheinlichkeit, dass ein Produkt innerhalb eines Jahres ausfällt . Als nächstes wird die Wahrscheinlichkeit vonn

p=1100000+1
n
(1p)n
n
1(11100001)n
n=10000P100000.095P2000000.87

Natürlich sollten Sie Ihre Daten weiterhin aktualisieren, während weitere Produkte verkauft werden. Andernfalls schlägt eines fehl.


10,000200,000200000/1000012

@whuber, behoben
Aksakal

1
(1) Entweder Sie haben sich verrechnet oder Ihre "200000" ist ein Tippfehler für "20000". (Sie sollten ungefähr erhalten0.865

@whuber, ja, es war eins weniger null
Aksakal

5

Zu dieser Frage wurden mehrere gute Antworten gegeben, aber kürzlich hatte ich die Gelegenheit, einige Ressourcen zu diesem Thema zu lesen, und beschloss, die Ergebnisse mitzuteilen.

k=0n

(1)P(K=k)=kn=0

Eine solche Schätzung ist eher unbefriedigend, da die Tatsache, dass wir in unserer Stichprobe keine Fehler festgestellt haben, kaum beweist, dass sie im Allgemeinen unmöglich sind. Unsicherheiten lassen darauf schließen, dass eine gewisse Wahrscheinlichkeit eines Ausfalls besteht, auch wenn (noch) keine beobachtet wurden. Wenn wir von vornherein wissen, wenden wir Bayes'sche Methoden an, die von Bailey (1997), Razzaghi (2002), Basu et al. (1996) sowie Ludbrook und Lew (2009) besprochen wurden.

Unter einfachen Schätzern "obere Schranke" Schätzer, der annimmt (Bailey, 1997)

dass es für einen Schätzer für P im Null-Fehler-Fall nicht logisch wäre, eine Wahrscheinlichkeit zu ergeben, die über der vom Maximum-Likelihood-Schätzer im Ein-Fehler-Fall vorhergesagten, einer vernünftigen Obergrenze, liegt

definiert als

(2)1n

kann erwähnt werden. Wie von Ludbrook und Lew (2009) besprochen, sind andere Möglichkeiten "Dreierregel" (vgl. Hier) , Wikipedia oder Eypasch et al, 1995)

(3)3n

oder andere Variationen:

(4)3n+1

"rule of 3.7" von Newcombe und Altman (oder von 3.6):

(5)3.7n

"neue Regel von vier":

(6)4n+4

aber wie von Ludbrook und Lew (2009) festgestellt, ist "Dreierregel" "fast unbrauchbar" und "Regel 3.6" (und 3.7) "haben schwerwiegende Einschränkungen - sie sind grob ungenau, wenn die anfängliche Stichprobengröße weniger als 50 beträgt." und sie empfehlen nicht die Methoden (3) - (6), sondern die Verwendung geeigneter Bayes'scher Schätzer (siehe unten).

Unter den Bayes'schen Schätzern können verschiedene genannt werden. Erster solcher von Bailey (1997) vorgeschlagener Schätzer ist

(7)10.51n

zur Schätzung des Medians unter Uniform Prior

(8)10.51n+1

oder zum Schätzen des Mittelwerts unter einem solchen vor

(9)1n+2

Ein weiterer Ansatz unter der Annahme eines exponentiellen Fehlermusters mit konstanter Ausfallrate (Poisson-Verteilungen) ergibt

(10)1/3n

ab

(11)aa+b+n

a=b=1a=b=0.5

(12)12(n+1)

n klein ist.


Bailey, RT (1997). Schätzung aus Null-Fehlerdaten. Risk Analysis, 17 , 375 & ndash; 380.

Razzaghi, M. (2002). Zur Abschätzung der binomialen Erfolgswahrscheinlichkeit bei einem Vorkommen von Null in der Stichprobe. Journal of Modern Applied Statistical Methods, 1 (2), 41.

Ludbrook, J. & Lew, MJ (2009). Schätzung des Risikos seltener Komplikationen: Ist die Dreierregel gut genug?ANZ Journal of Surgery, 79 (7-8), 565-570.

E. Eypasch, R. Lefering, CK Kum und H. Troidl (1995). Wahrscheinlichkeit von unerwünschten Ereignissen, die noch nicht aufgetreten sind: Eine statistische Erinnerung. BMJ 311 (7005): 619–620.

Basu, AP, Gaylor, DW & Chen, JJ (1996). Abschätzung der Wahrscheinlichkeit des Auftretens eines Tumors bei einem seltenen Krebs ohne Vorkommen in einer Stichprobe. Regulatory Toxicology and Pharmacology, 23 (2), 139 & ndash; 144.


1
Hervorragende Bewertung dessen, was da draußen ist!
AlefSin

Bei den Kommentaren, die mit "Unter Bayes'schen Schätzern mehrere ..." beginnen, ist im Allgemeinen nicht klar, ob sich ein gegebener Kommentar auf die darüber oder darunter stehende Formel bezieht. Können Sie das klarer machen?
gung - Wiedereinsetzung von Monica

2

Sie müssen wirklich zu den Designern Ihrer Produkte zurückkehren. Es ist ein grundlegendes technisches Problem, kein beobachtendes statistisches. Sie haben eine Vorstellung von der Ausfallwahrscheinlichkeit jeder Komponente und davon, mit welcher Wahrscheinlichkeit das gesamte zusammengebaute Produkt netto ausfällt. Sie können die erwartete Anzahl von Fehlern über die gesamte Lebensdauer des Produkts anzeigen.

Ein Bauingenieur entwirft eine Brücke mit einer Lebensdauer von 120 Jahren. Jede Komponente der Brücke hat eine geringe Ausfallwahrscheinlichkeit. Jede Ladung hat eine geringe Chance, überschritten zu werden. Damit die Brücke wirtschaftlich gebaut werden kann, würde sie nur einmal in 2400 Jahren vollständig einstürzen. Dies ist weitaus länger als die Brücke, für die sie instand gehalten wird. Es ist nicht verwunderlich, dass die Brücke weder in Jahr 1 noch in Jahr 2 bis Jahr 120 ausfällt. Das ist nicht zusammengebrochen und sagt Ihnen sehr wenig. Die verschiedenen Ausfallwahrscheinlichkeiten können nur von den ursprünglichen Designern eingeschätzt werden.


0

Dies ähnelt einem Problem, mit dem ich konfrontiert war, als wir ein neues Herstellungsverfahren einführten, um einen Produktionsfehler zu beseitigen.

Da das neue System keine Fehler verursachte, stellten sich die Leute die gleiche Frage: Wie prognostizieren wir die Fehlerrate? In Ihrem Fall wurden die zeitlichen Auswirkungen beseitigt, da Sie einen Zeitraum festgelegt haben, über den der Fehler auftreten kann, ohne sich darum zu kümmern, wann der Fehler innerhalb dieses Zeitraums auftritt. Und es geht einfach darum, ob etwas fehlgeschlagen ist oder nicht. Damit vereinbart - mit meiner Antwort.

Intuitiv scheint es, dass wir mindestens einen Fehler benötigen, um die Fehlerrate berechnen zu können. Diese Annahme enthält jedoch einen impliziten Fehler. Wir werden die Ausfallrate niemals berechnen. Das liegt daran, dass es sich um eine Stichprobe handelt. Daher können wir nur einen Bereich wahrscheinlicher Ausfallraten abschätzen. Der Weg, dies zu tun, besteht darin, eine Verteilung für die Ausfallrate zu finden. Die Verteilung, die in diesem Fall die Aufgabe erfüllt, ist eine Beta-Verteilung, bei der die Parameter wie folgt lauten: α = n + 1 und β = N - n + 1

Hinweis: N ist die Stichprobengröße und n ist die Anzahl der Fehler (in Ihrem Fall 0).

Für Ihr Szenario ist die Verteilung der Ausfallrate unten dargestellt. Bildbeschreibung hier eingeben .

Sie würden diese Verteilung dann in die jeweilige Binomialwahrscheinlichkeitsformel eingeben, um eine Verteilung für die Wahrscheinlichkeit eines Ausfalls einer Einheit zu erhalten (dies kann analytisch oder mit Monte Carlo erfolgen). Ich vermute, dass die Zahlen sehr niedrig sein werden.

Beachten Sie, dass dieser Vorgang unabhängig von der Anzahl der Fehler in Ihrem ersten Satz angewendet werden kann.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.