Verwenden Sie nicht die normale Annäherung
Über dieses Problem ist schon viel geschrieben worden. Ein allgemeiner Rat ist, niemals die normale Annäherung (dh das asymptotische / Wald-Konfidenzintervall) zu verwenden, da es schreckliche Abdeckungseigenschaften hat. R-Code zur Veranschaulichung:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
Für kleine Erfolgswahrscheinlichkeiten fordern Sie möglicherweise ein Konfidenzintervall von 95% an, aber tatsächlich erhalten Sie beispielsweise ein Konfidenzintervall von 10%!
Empfehlungen
Also, was sollen wir verwenden? Ich glaube, dass die aktuellen Empfehlungen diejenigen sind, die in der Veröffentlichung Interval Estimation for a Binomial Proportion von Brown, Cai und DasGupta in Statistical Science 2001, vol. 16, nein. 2, Seiten 101–133. Die Autoren untersuchten verschiedene Methoden zur Berechnung von Konfidenzintervallen und kamen zu folgendem Ergebnis.
[W] Wir empfehlen das Wilson-Intervall oder das gleichschwänzige Jeffreys-Intervall für kleine n und das in Agresti und Coull vorgeschlagene Intervall für größere n .
Das Wilson-Intervall wird manchmal auch als Bewertungsintervall bezeichnet , da es auf der Invertierung eines Bewertungstests basiert.
Berechnung der Intervalle
Um diese Konfidenzintervalle zu berechnen, können Sie diesen Online-Rechner oder die binom.confint()
Funktion im binom
Paket in R verwenden. Für 0 Erfolge in 25 Versuchen wäre der R-Code beispielsweise:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
Hier bayes
ist das Jeffreys-Intervall. (Das Argument type="central"
wird benötigt, um das gleichseitige Intervall zu erhalten.)
Beachten Sie, dass Sie sich vor der Berechnung des Intervalls für eine der drei Methoden entscheiden sollten . Wenn Sie sich alle drei ansehen und die kürzeste auswählen, erhalten Sie natürlich eine zu geringe Abdeckungswahrscheinlichkeit.
Eine schnelle, ungefähre Antwort
Als abschließende Bemerkung, wenn Sie genau Null Erfolge in Ihrer beobachten n Studien und wollen einfach nur eine sehr schnelle ungefähre Konfidenzintervall, können Sie die Verwendung der Regel von drei . Teilen Sie einfach die Zahl 3 durch n . Im obigen Beispiel ist n 25, die obere Grenze ist also 3/25 = 0,12 (die untere Grenze ist natürlich 0).