Einige Möglichkeiten bietet der Wikipedia-Artikel über die Binomialverteilung im Abschnitt über die normale Approximation , der derzeit den folgenden Kommentar enthält (Hervorhebung von mir):
Eine andere häufig verwendete Regel ist, dass beide Werte und n ( 1 - p ) größer als 5 sein müssen. Die spezifische Anzahl variiert jedoch von Quelle zu Quelle und hängt davon ab, wie gut eine Annäherung sein soll.npn ( 1 - p )
Dies ist nun damit verbunden, sicherzustellen, dass die normale Näherung innerhalb der gesetzlichen Grenzen für eine Binomialvariable x ∈ [ 0 , n ] liegt .x ∼ N.( μ , σ)x ∈ [ 0 , n ]
Um dies zu formulieren: Wenn wir die gewünschte Abdeckungswahrscheinlichkeit in Form eines z-Scores parametrisieren , haben wir
μ ± z σ ∈ [ 0 , n ]z> 0
Unter Verwendung der Binomialmomenteμ=npund σ 2 =np(1-p)erfordern die obigen Einschränkungen
min
μ ± zσ∈ [ 0 , n ]⟹zσ≤ min [μ,n - μ]]⟹z2≤ min [μ2σ2,( n - μ )2σ2]]
μ = n pσ2= n p ( 1 - p )
Für diesen Ansatz würde
z2=5einer Abdeckungswahrscheinlichkeit von
Φ[ √ entsprechenMindest[p, 1 - p] n≥z2
z2= 5
wobei
Φ die
normale Standard-CDF ist.
Φ [ 5- -√] - Φ [ - 5- -√] ≈ 97,5 %
Φ
In dem Maße, in dem diese Überdeckungswahrscheinlichkeit "hübsch" ist und 5 eine schöne runde Zahl ist ... könnte das vielleicht eine Rechtfertigung geben? Ich habe nicht viel Erfahrung mit Wahrscheinlichkeitstexten und kann daher nicht sagen, wie häufig "5" im Vergleich zu anderen "spezifischen Zahlen" verwendet wird, um die Formulierung von Wikipedia zu verwenden. Ich habe das Gefühl, dass 5 nichts Besonderes ist, und Wikipedia schlägt vor, dass 9 ebenfalls häufig vorkommt (entsprechend einem "hübschen" von 3).z