Ich interpretiere die Frage folgendermaßen: Angenommen, die Probenahme wurde angeblich so durchgeführt, als würden weiße Papiertickets in ein Glas gegeben, das jeweils mit dem Namen einer Person beschriftet ist, und wurden nach gründlichem Rühren des Glasinhalts zufällig herausgenommen. Zuvor waren der Tickets rot gefärbt. Wie groß ist die Wahrscheinlichkeit, dass genau zwei der ausgewählten Tickets rot sind? Wie groß ist die Wahrscheinlichkeit, dass höchstens zwei der Tickets rot sind?36323212
Eine genaue Formel kann erhalten werden, aber wir müssen nicht so viel theoretische Arbeit leisten. Stattdessen verfolgen wir nur die Chancen, wenn die Tickets aus dem Glas gezogen werden. Zu dem Zeitpunkt, an dem von ihnen zurückgezogen wurden, soll die Chance, dass genau rote Tickets gesehen wurden, . Beachten Sie zunächst, dass wenn (Sie können keine roten Tickets haben, bevor Sie beginnen) und (es ist sicher, dass Sie keine roten Tickets haben am Anfang). Bei der letzten Ziehung war das Ticket entweder rot oder nicht. Im ersten Fall hatten wir zuvor die Chance , genaumip(i,m)p(i,0)=0i>0p(0,0)=1p(i−1,m−1)i−1rote Tickets. Wir dann geschahen dann einen roten von den übrigen ziehen Tickets, so dass es genau rot bisher Tickets. Da wir davon ausgehen, dass alle Tickets in jeder Phase die gleichen Chancen haben, betrug unsere Chance, auf diese Weise ein Rot zu ziehen, . Im anderen Fall hatten wir die Chance , genau rote Tickets in den vorherigen Ziehungen zu erhalten, und die Chance , der Stichprobe bei der nächsten Ziehung kein weiteres rotes Ticket hinzuzufügen, war363−m+1i(12−i+1)/(363−m+1)p(i,m−1)im−1(363−m+1−12+i)/(363−m+1). Woher, unter Verwendung grundlegender Wahrscheinlichkeitsaxiome (dh die Chancen zweier sich gegenseitig ausschließender Fälle addieren sich und die bedingten Chancen multiplizieren sich),
p(i,m)=p(i−1,m−1)(12−i+1)+p(i,m−1)(363−m+1−12+i)363−m+1.
Wir wiederholen diese Berechnung rekursiv und legen ein dreieckiges Array der Werte von für und . Nach einer kleinen Berechnung erhalten wir und und beantworten beide Versionen der Frage. Dies sind kleine Zahlen: Egal wie Sie es betrachten, es sind ziemlich seltene Ereignisse (seltener als eins zu tausend).0 ≤ i ≤ 12 0 ≤ m ≤ 232 p ( 2 , 232 ) ≈ 0,000849884 p ( 0 , 232 ) + P ( 1 , 232 ) + P ( 2 , 232 ) ≈ 0,000934314p(i,m)0≤i≤120≤m≤232p(2,232)≈0.000849884p(0,232)+p(1,232)+p(2,232)≈0.000934314
Zur Überprüfung habe ich diese Übung 1.000.000 Mal mit einem Computer durchgeführt. In 932 = 0,000932 dieser Experimente wurden 2 oder weniger rote Tickets beobachtet. Dies liegt sehr nahe am berechneten Ergebnis, da die Stichprobenschwankung im erwarteten Wert von 934,3 etwa 30 (nach oben oder unten) beträgt. So wird die Simulation in R durchgeführt:
> population <- c(rep(1,12), rep(0, 363-12)) # 1 is a "red" indicator
> results <- replicate(10^6,
sum(sample(population, 232))) # Count the reds in 10^6 trials
> sum(results <= 2) # How many trials had 2 or fewer reds?
[1] 948
Dieses Mal änderten sich die Ergebnisse ein wenig, da die Experimente zufällig waren: In 948 der Millionen Versuche wurden zwei oder weniger rote Tickets beobachtet. Das stimmt immer noch mit dem theoretischen Ergebnis überein.)
Die Schlussfolgerung ist, dass es höchst unwahrscheinlich ist, dass zwei oder weniger der 232 Tickets rot sind. Wenn Sie tatsächlich eine Stichprobe von 232 von 363 Personen haben, ist dieses Ergebnis ein starker Hinweis darauf, dass das Ticket-in-a-Jar-Modell keine korrekte Beschreibung der Art und Weise ist, wie die Stichprobe erhalten wurde. Alternative Erklärungen umfassen (a) das Herausnehmen der roten Tickets aus dem Glas (eine "Voreingenommenheit" gegen sie) sowie (b) das Färben der Tickets nach Beobachtung der Probe ( Post-hoc- Daten-Snooping) nicht gegebenenfalls im bias).
Ein Beispiel für die Erklärung (b) in Aktion wäre ein Jury-Pool für einen berüchtigten Mordprozess. Angenommen, es umfasste 363 Personen. Aus diesem Pool befragte das Gericht 232 von ihnen. Ein ehrgeiziger Zeitungsreporter überprüft akribisch den Lebenslauf aller im Pool und stellt fest, dass 12 der 363 Goldfischliebhaber waren, aber nur zwei von ihnen wurden interviewt. Ist das Gericht gegen Goldfischzüchter voreingenommen? Wahrscheinlich nicht.