Sie beobachten k Köpfe aus n Würfen. Ist die Münze fair?

Diese Frage wurde mir in einem Interview mit $(n, k) = (400, 220)$ gestellt. Gibt es eine "richtige" Antwort?

Angenommen, die Würfe sind iid und die Wahrscheinlichkeit von Köpfen ist $p=0.5$ . Die Verteilung der Anzahl der Köpfe in 400 Würfen sollte dann in der Nähe von Normal (200, 10 ^ 2) liegen, so dass 220 Köpfe 2 Standardabweichungen vom Mittelwert entfernt sind. Die Wahrscheinlichkeit, ein solches Ergebnis zu beobachten (dh mehr als 2 SDs vom Mittelwert in beide Richtungen entfernt), liegt bei etwas weniger als 5%.

Der Interviewer sagte mir im Wesentlichen: "Wenn ich etwas> = 2 SDs aus dem Mittelwert beobachte, schließe ich, dass etwas anderes vor sich geht. Ich würde wetten, dass die Münze fair ist." Das ist vernünftig - schließlich machen das die meisten Hypothesentests. Aber ist das das Ende der Geschichte? Für den Interviewer schien das die "richtige" Antwort zu sein. Was ich hier frage, ist, ob eine Nuance gerechtfertigt ist.

Ich konnte nicht anders, als darauf hinzuweisen, dass die Entscheidung, dass die Münze nicht fair ist, eine bizarre Schlussfolgerung in diesem Kontext des Münzwurfs ist. Habe ich recht, das zu sagen? Ich versuche es weiter unten zu erklären.

Erstens habe ich - und ich nehme an, auch die meisten Menschen - eine starke Priorität in Bezug auf Münzen: Es ist sehr wahrscheinlich, dass sie fair sind. Das hängt natürlich davon ab, was wir unter fair verstehen. Eine Möglichkeit wäre, "fair" als "mit einer Wahrscheinlichkeit von Köpfen" nahe "bei 0,5, beispielsweise zwischen 0,49 und 0,51, zu definieren."

(Sie können auch ‚fair‘ definieren was bedeutet , dass die Wahrscheinlichkeit von Köpfen ist genau 0,50, wobei in diesem Fall mit einer perfekt fairen Münze jetzt eher scheint un wahrscheinlich.)

Ihr Prior hängt möglicherweise nicht nur von Ihren allgemeinen Vorstellungen über Münzen ab, sondern auch vom Kontext. Wenn Sie die Münze aus Ihrer eigenen Tasche gezogen haben, können Sie sich sicher sein, dass sie fair ist. Wenn Ihr Zaubererfreund es aus seinem herauszieht, könnte Ihr Prior doppelköpfigen Münzen mehr Gewicht beimessen.

In jedem Fall ist es einfach, vernünftige Prioritäten zu finden, die (i) die Wahrscheinlichkeit erhöhen, dass die Münze fair ist, und (ii) die Ähnlichkeit Ihres Seitenzahns bewirken, selbst wenn Sie 220 Köpfe beobachten. Sie würden dann den Schluss ziehen, dass die Münze sehr wahrscheinlich fair ist, obwohl das Ergebnis 2 SDs vom Mittelwert abweicht.

Tatsächlich könnten Sie auch Beispiele konstruieren, bei denen das Beobachten von 220 Köpfen in 400 Würfen dazu führt, dass Ihr Posterior mehr Gewicht auf die faire Münze legt , zum Beispiel, wenn alle unfairen Münzen eine Wahrscheinlichkeit von Köpfen in . $\{0, 1\}$

Kann mir jemand etwas Licht ins Dunkel bringen?

Nachdem ich diese Frage geschrieben hatte, fiel mir ein, dass ich schon einmal von dieser allgemeinen Situation gehört hatte - ist es nicht Lindleys "Paradoxon" ?

Whuber hat einen sehr interessanten Link in die Kommentare eingefügt: Sie können einen Würfel laden , aber Sie können keine Münze voreingenommen lassen . Ab Seite 3:

Es ist nicht sinnvoll zu sagen, dass die Münze eine Wahrscheinlichkeit p von Köpfen hat, da sie vollständig durch die Art und Weise bestimmt werden kann, in der sie geworfen wird - es sei denn, sie wird mit einem schnellen Schleudergang hoch in die Luft geworfen und mit in der Luft gefangen kein Prellen, in diesem Fall ist p = 1/2.

Ziemlich cool! Dies knüpft auf interessante Weise an meine Frage an: Nehmen wir an, wir wissen, dass die Münze "mit einem schnellen Schleudern hoch in die Luft geworfen und in der Luft gefangen wird, ohne zu hüpfen". Dann sollten wir definitiv nicht die Hypothese ablehnen, dass die Münze fair ist (wobei "fair" jetzt "mit p = 1/2, wenn es auf die oben beschriebene Weise geworfen wird" bedeutet), weil wir effektiv einen Prior haben, der alle Wahrscheinlichkeit auf das setzt Münze ist fair. Vielleicht rechtfertigt das bis zu einem gewissen Grad, warum es mir unangenehm ist, die Null zurückzuweisen, nachdem 220 Köpfe beobachtet wurden.

— Adrian
quelle

Würde sich ein Teil Ihrer Frage ändern, wenn Sie die "Münze" als Metapher für einen binären Prozess interpretieren würden, über den Sie keine Vorkenntnisse hatten?

— Whuber

@whuber Das ist eine gute Frage. Ich denke, in diesem Fall wäre ich eher bereit, "reject when p <= 0.05" zu wählen, obwohl ich mir nicht ganz sicher bin, wie ich das für mich selbst rechtfertigen soll.

— Adrian

Ein weiteres Problem, das mich stört, ist, dass die Person, die die Frage gestellt hat, an der Hypothese interessiert war, dass p = 0,50 genau ist. Wenn Sie jedoch davon ausgehen, dass p kontinuierlich verteilt ist, hat dies eine Wahrscheinlichkeit von Null, unabhängig davon, was Sie beobachten. Es erscheint mir sinnvoller, Aussagen über p zu treffen, die zu einem Intervall gehören. Dies wäre ein Problem in einer Situation, in der ich keine Vorkenntnisse hatte und mich zum Beispiel für die Verwendung eines einheitlichen Prior entschied.

— Adrian

Es ergibt Sinn. Die münzbezogene Frage ist jedoch etwas ablenkend, da Antworten auf solche Fragen in der Regel in Diskussionen über die Physik (und den Umgang mit Geld) des Münzwurfs fließen. Sie sind möglicherweise schockiert darüber, inwieweit die tatsächliche Situation Ihren starken Vorgesetzten widerspricht, je nachdem, wie die Münze geworfen wird. "Es ist nicht sinnvoll zu sagen, dass die Münze eine Wahrscheinlichkeit

von Köpfen hat"

p

$p$ .

— Whuber

@Adrian DJC MacKay erörtert dieses genaue Problem (mit n = 250, k = 140) in seinem kostenlosen Lehrbuch unter folgendem Link: inference.phy.cam.ac.uk/itprnn/book.pdf (S. 63) Lesen Sie, was er sagt. Er kommt zu einem ähnlichen Ergebnis wie Sie.

— Flunder

Antworten:

Die übliche bayesianische Methode zur Lösung dieses Problems (ohne normale Näherungen) besteht darin, Ihren vorherigen Stand explizit anzugeben und ihn mit Ihrer Wahrscheinlichkeit zu kombinieren, die Beta-verteilt ist. Integrieren Sie dann Ihren Seitenzahn um 50%, sagen wir zwei Standardabweichungen oder von 49% –51% oder was auch immer Sie möchten.

Wenn Ihre vorherige Annahme bei [0,1] beständig ist - z. B. Beta (100,100) (diese legt eine Menge Masse auf ungefähr faire Münzen) - dann ist die Wahrscheinlichkeit, dass die Münze fair ist, null, da die Wahrscheinlichkeit ebenfalls beständig ist [0] , 1].

Selbst wenn die Wahrscheinlichkeit, dass die Münze fair ist, gleich Null ist, können Sie in der Regel jede Frage, die Sie beantworten wollten, mit dem Posterior über die Voreingenommenheit beantworten. Zum Beispiel, was ist der Casino-Vorteil bei der Verteilung nach hinten über die Münzwahrscheinlichkeiten.

— Neil G
quelle

+1, aber ich möchte diese Antwort nur ein wenig ergänzen. Angenommen, wir definieren eine faire Münze als

wie es das OP vorschlägt, und wir möchten

unserer vorherigen Wahrscheinlichkeit dafür ausgeben, dass dies der Fall ist. Dann ist eine vernünftige Priorität

, so dass

Unter Berücksichtigung der Daten in der Frage wird die posteriore Verteilung zu

0.49 < p < 0.51

$0.49 < p < 0.51$

99 %

$99\%$

p \sim Beta (8300, 8300)

$p \sim \text{Beta}(8300, 8300)$

P (p \in (0.49, 0.51)) = 0.99003.

$P(p \in (0.49, 0.51)) = 0.99003.$

und die hintere Wahrscheinlichkeit einer fairen Münze ist immer noch sehr groß:

p | data \sim Beta (8300 + 220, 8300 + 180)

$p|\text{data} \sim \text{Beta}(8300+220, 8300+180)$

P (p \in (0.49, 0.51) | data) = 0.9886.

$P(p \in (0.49, 0.51)|\text{data}) = 0.9886.$

— Knrumsey

Sagen wir für die Bernoulli Distribution, in diesem Fall den Münzwurf.

$B(n=400,p=0.5)$ $N(\mu=200,\sigma^2=100)$

$k$ $95\%$ $B(n=400,p=0.5)$ $p$ $B(n=400,p=0.5,k=220)$

$p=0.5$ $\pi(p=0.5)=0.5$ $\pi(p\neq0.5)=0.5$

$\pi(0.49\leq p\leq0.51)=0.9$ $\pi(p<0.49 \cup p>0.51)=0.1$ $p$

$P(0.49\leq p\leq0.51|k=220)$

$p$ $N(\mu=0.5,\sigma^2=0.25)$ $\sigma^2=0.1$

$p$ $f(p|k=220)$

Mein Ruf reicht nicht aus, um einen Kommentar unter die Frage zu schreiben. Stattdessen werde ich hier etwas über You Can't Bias a Coin schreiben . @Adrian

Hier ist was wir haben

$B(n=400,k=220,p=\theta)$
Die theoretische und experimentelle Studie You Can't Bias a Coin

Hier ist unsere Hypothese

$H_0:$ $\hat\theta=0.5$

$H_1$

Hier ist unser Ergebnis

$H_0$
$H_1$

$p$ $H_0$ $H_1$

Andernfalls erstellen wir hier einen Doppelstandard für das Testen von Hypothesen. Wir können die Hypothese, dass der Münzwurf fair ist und die Versuchsdaten korrekt aufgezeichnet wurden, nicht akzeptieren .

Es ist nicht sinnvoll zu sagen, dass die Münze eine Wahrscheinlichkeit p von Köpfen hat

Wir haben experimentelle Ergebnisse, um diese Hypothese zu untermauern.

$p$ $N(\mu=0.5,\sigma^2)$

$\sigma^s$

— Zhang Tschao
quelle

Vielen Dank, Zhang. Ein winziger Punkt: Wenn Sie die Normalverteilung für Ihre Prioritäten über die Wahrscheinlichkeit von Köpfen verwenden möchten, würde ich sagen, dass Sie sie abschneiden sollten, damit p in [0, 1] liegt.

— Adrian

Natürlich gibt es viele vernünftige Vorverteilungen und entsprechende Nachfolger. Der eigentliche Punkt meiner Frage ist allgemeiner: Die Entscheidung, dass die Münze nicht fair ist, scheint mir in diesem Zusammenhang eine bizarre Schlussfolgerung zu sein. Was denkst du darüber - und warum?

— Adrian

Ein passender Prior wäre hier die Beta-Verteilung, da sie mit der Binomial-Wahrscheinlichkeit konjugiert ist. Aber auch hier ist der eigentliche Schwerpunkt meiner Frage allgemeiner als der konkrete Schwerpunkt.

— Adrian

π (p = 0.5)

$\pi(p=0.5)$

p \sim U (0, 1)

$p \sim U(0,1)$

E (p) \sim f (p | k = 220)

$E(p) \sim f(p|k=220)$

p = 0.5

$p=0.5$

E (p)

$E(p)$ . Und wir akzeptieren leicht die Hypothese, dass die Münze nicht fair ist. Besonders in diesem Fall werden Sie es nicht für eine bizarre Schlussfolgerung halten, die Münze als nicht fair zu betrachten.

— Zhang Tschao

@ user777 Die Normalverteilung erscheint zweimal in Zhangs Antwort, erstens als Annäherung an das Binom (groß) und zweitens als Prior für die Wahrscheinlichkeit von Köpfen (wenn er sagt, "der Prior ist eine Normalverteilung p ~ N"). Zhang - Ihr Beitrag über das Null-Zeichen "Die Münze ist fair und die Daten wurden korrekt aufgezeichnet" ist interessant. Vielen Dank, dass Sie es veröffentlicht haben.

— Adrian