Bestimmung der Stichprobengröße mit Anteil und Binomialverteilung


10

Ich versuche, einige Statistiken mit dem Buch Biometrie von Sokal und Rohlf (3e) zu lernen. Dies ist eine Übung im 5. Kapitel, die die Wahrscheinlichkeit, die Binomialverteilung und die Poisson-Verteilung behandelt. Geben Sie hier die Bildbeschreibung ein

Mir ist klar, dass es eine Formel gibt, um eine Antwort auf diese Frage zu erhalten: Diese Gleichung ist jedoch nicht in diesem Text enthalten. Ich möchte wissen, wie die Stichprobengröße berechnet wird, wobei nur die Wahrscheinlichkeit, das gewünschte Konfidenzniveau und die Binomialverteilung bekannt sind. Gibt es Ressourcen zu diesem Thema, auf die ich verweisen kann? Ich habe Google ausprobiert, aber was ich bisher gesehen habe, erfordert Informationen, auf die ich bei diesem Problem keinen Zugriff habe.

n=4(pq)2

1
Möchten Sie auf eine Reise geführt werden, um die Antwort herauszufinden, oder möchten Sie lieber nur die Antwort erhalten, zusammen mit einer Erklärung, warum es die Antwort ist?
Jbowman

2
Eine Reise klingt schön. Dies ist nicht für eine Klasse und die Antwort wird am Ende der Frage gegeben. Ich möchte nicht nur die Antwort wissen - ich weiß es bereits! Ich habe vor vielen Jahren einen Statistikkurs besucht, aber ich habe ihn damals nicht genug geschätzt. Ich versuche jetzt Abhilfe zu schaffen und beginne wirklich, die zugrunde liegenden Muster zu verstehen. Ich würde mich über die Hilfe freuen. Dieses spezielle Problem scheint nicht mit den anderen in diesem Abschnitt übereinzustimmen, und ein angemessener Ansatz wird (für mich) weder anhand der Informationen des Textes zur Binomialverteilung noch anhand der angegebenen Beispiele deutlich.
verblüfft

1
Ich wäre sehr daran interessiert, eine ausführliche Antwort (mit Hinweisen auf weitere Informationen, falls erforderlich) auf diese Frage zu lesen.
Zhubarb

2
Betrachten wir ein konkretes, einfaches Beispiel. Sie haben 5 Folien von einer Person, die den Erreger hat. Wie hoch ist die Wahrscheinlichkeit, dass Sie diese Person nicht korrekt als Erreger identifizieren? Eine versteckte Annahme ist, dass die Anwesenheit / Abwesenheit des Pathogens auf einem Objektträger unabhängig von der Anwesenheit / Abwesenheit des Pathogens auf anderen Objektträgern ist, die derselben Probe entnommen wurden.
Jbowman

1
Das wäre die Wahrscheinlichkeit, 5 falsche Negative hintereinander zu erhalten:
verblüfft

Antworten:


8

Das wäre die Wahrscheinlichkeit, in 5 Folien ein falsches Negativ zu erhalten:

(0,80) 5 = 0,32768

Ahhh, um die Wahrscheinlichkeit falsch negativer Ergebnisse unter 1% zu verringern, können Sie Folgendes tun:

> x <- matrix(c(0), nrow=25)
> for(i in 1:25) x[i] = (0.8)^i
> x
             [,1]
 [1,] 0.800000000
 [2,] 0.640000000
 [3,] 0.512000000
 [4,] 0.409600000
 [5,] 0.327680000
 [6,] 0.262144000
 [7,] 0.209715200
 [8,] 0.167772160
 [9,] 0.134217728
 [10,] 0.107374182
 [11,] 0.085899346
 [12,] 0.068719477
 [13,] 0.054975581
 [14,] 0.043980465
 [15,] 0.035184372
 [16,] 0.028147498
 [17,] 0.022517998
 [18,] 0.018014399
 [19,] 0.014411519
 [20,] 0.011529215
 [21,] 0.009223372
 [22,] 0.007378698
 [23,] 0.005902958
 [24,] 0.004722366
 [25,] 0.003777893

Und stellen Sie fest, dass die Falsch-Positiv-Rate bei i = 21 weniger als 1% beträgt.

Groß! Vielen Dank. Ich kann nicht glauben, dass ich das nicht gesehen habe. Ich habe aus irgendeinem Grund alle Arten von bedingten Wahrscheinlichkeiten und dergleichen ausprobiert. Halten Sie es einfach dumm...


1
Ja, manchmal sind die einfachsten Probleme die schwierigsten!
Jbowman
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.