Wie oft muss ich einen Würfel werfen, um seine Fairness sicher zu beurteilen?


22

(Bitte entschuldigen Sie sich im Voraus für die Verwendung der Laiensprache anstelle der statistischen Sprache.)

Wenn ich die Wahrscheinlichkeit messen möchte, dass jede Seite eines bestimmten physischen sechsseitigen Würfels mit hinreichender Sicherheit auf +/- 2% gewürfelt wird, wie viele Musterwürfeln wären erforderlich?

Dh wie oft müsste ich einen Würfel werfen, wobei jedes Ergebnis gezählt wird, um zu 98% sicher zu sein, dass die Chancen, dass jede Seite gewürfelt wird, zwischen 14,6% und 18,7% liegen? (Oder ähnliche Kriterien, bei denen man zu 98% sicher ist, dass der Würfel innerhalb von 2% liegt.)

(Dies ist eine reale Angelegenheit für Simulationsspiele, bei denen Würfel verwendet werden und bei denen sichergestellt werden soll, dass bestimmte Würfelentwürfe eine annehmbare Wahrscheinlichkeit von 1/6 haben. Es wird behauptet, dass bei vielen gängigen Würfelentwürfen das Würfeln um 29% 1 gemessen wurde mehrere solcher Würfel jeweils 1000-mal würfeln.)


1
Dies ist viel schwieriger, als das Konfidenzintervall für ein Binomial zu ermitteln, da Sie alle Wahrscheinlichkeiten in Schach halten möchten. Schauen Sie sich Hsiuying Wangs Artikel über simultane Konfidenzintervalle für multinomiale Verteilungen an ( Journal of Multivariate Analysis 2008, 99, 5, 896-911). In diesem Blog-Beitrag finden Sie Code , der auch eine kurze Zusammenfassung einiger der Arbeiten enthält, die an diesem Thema durchgeführt wurden.
IDNAVID

1
Beachten Sie, dass dies die Frage sehr vereinfacht, wenn Sie nur prüfen möchten, ob Einsen in angemessener Zeit gewürfelt wurden.
Dennis Jaheruddin

2
Es ist wichtig zu beachten, dass das "Konfidenzintervall" keine "prozentuale Wahrscheinlichkeit der Richtigkeit" ergibt. Ich vermute, dass Sie die sehr vernünftige Verwendung des Begriffs "98% sicher" verwenden, aber Sie müssen wissen, wann immer jemand ein "Konfidenzintervall" erwähnt, das überhaupt nicht mit einer 98% igen Wahrscheinlichkeit übereinstimmt: link.springer.com/ article / 10.3758% 2Fs13423-013-0572-3
BrianH

1
@BrianH Danke! Ich habe nicht nur den umgangssprachlichen Ausdruck gemeint, sondern möchte die durch den Test implizierte Gewissheit quantifizieren. Meines Erachtens ist es in der gleichen Weise sinnvoll zu sagen, dass ich davon ausgehe, dass ein Würfelergebnis in einem berechenbaren Prozentsatz der Zeit gewürfelt wird, dass es eine ähnliche (aber komplexere) Berechnung dafür geben würde, wie wahrscheinlich es ist, dass Ergebnisse gewürfelt werden Eine gewisse Fehlerquote beim n-maligen Würfeln, was meiner Meinung nach die Antwort von Xiamoi (und der nachfolgende Kommentar) ist. Ja?
Dronz

1
@Dronz Um fair zu sein, dies ist eines der Dinge, von denen du wirklich denkst, dass sie direkter sind, als es sich tatsächlich herausstellt. Tatsächlich teuflisch knifflig. Hier einige wichtige Fragen an anderer Stelle , um Hilfe geben Ihnen eine Vorstellung davon , wie es ist kein unglaublich geradlinig Antwort: frequentistischen math.stackexchange.com/questions/1578932/... Bayesian math.stackexchange.com/questions/1584833/... und Spaß: rpg.stackexchange.com/questions/70802/…
BrianH

Antworten:


18

TL; DR: wenn = 1/6 und Sie wollen wissen , wie groß Bedürfnisse 98% sicher sein , die Würfel fair (innerhalb von 2%), Bedürfnisse werden mindestens ≥ 766 .pnnn


Sei die Anzahl der Rollen und die Anzahl der Rollen, die auf einer bestimmten Seite landen. Dann folgt einer Binomialverteilung (n, p), wobei die Wahrscheinlichkeit ist, diese spezifizierte Seite zu erhalten.nXXp

Nach dem zentralen Grenzwertsatz wissen wir das

n(X/np)N(0,p(1p))

Da der Stichprobenmittelwert von Bernoulli Zufallsvariablen ist. Daher können für große Konfidenzintervalle für wie folgt konstruiert werdenX/nn(p)np

Xn±Zp(1p)n

Da unbekannt ist, können wir es durch den Stichprobenmittelwert ersetzen und durch verschiedene Konvergenzsätze wissen wir, dass das resultierende Konfidenzintervall asymptotisch gültig ist. So erhalten wir Konfidenzintervalle der Formpp = X / np^=X/n

p^±Zp^(1p^)n

mit . Ich gehe davon aus, dass Sie wissen, was Scores sind. Wenn Sie beispielsweise ein Konfidenzintervall von 95% wünschen, nehmen Sie . Also haben wir für ein gegebenes Konfidenzniveaup^=X/nZZ=1.96α

p^±Zαp^(1p^)n

Angenommen, Sie möchten, dass dieses Konfidenzintervall kürzer als , und möchten wissen, wie groß eine Stichprobe ist, die wir für diesen Fall benötigen. Nun, dies ist gleichbedeutend mit der Frage, was erfülltCαnα

Zαp^(1p^)nαCα2

Was ist dann gelöst zu erhalten

nα(2ZαCα)2p^(1p^)

Geben Sie also Ihre Werte für , und Estimated , um eine Abschätzung für . Da unbekannt ist, handelt es sich nur um eine Schätzung, asymptotisch (wenn größer wird) sollte es jedoch genau sein.ZαCαp^nαpn


3
Vielen Dank. Da ich jahrzehntelang keine Hochschulmathematik mehr gemacht habe, kann ich Ihnen Schwierigkeiten bereiten, die Zahlen einzugeben und mir tatsächlich die Anzahl zu geben, mit der ich einen Würfel als Ganzzahl würfeln muss?
Dronz

9
Wenn und Sie wissen möchten, wie groß muss, um 98% sicher zu sein, dass der Würfel innerhalb von 2% liegt, muss mindestens . Ignoriere meinen letzten Kommentar, verwende falsches . p=1/6nnn766Cα
Xiaomi

4
Es könnte interessanter sein, die Multinomialverteilung zu betrachten, da wir jetzt für jede Seite separat testen. Dabei werden nicht alle Informationen berücksichtigt, die wir zu dem Problem haben. Für einen intiuitive Erklärung Blick auf stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
Jan

5
Ich stimme @Jan zu: Diese Antwort beantwortet die Frage nicht. Darüber hinaus ist es nicht einfach, eine Antwort zu konstruieren, indem sie separat auf alle sechs Flächen angewendet wird, da die sechs Tests voneinander abhängig sind.
Whuber

3
Dies ist eine schöne Antwort, aber ich stimme voll und ganz mit Jan überein, whuber. Diese Frage verdient eine Antwort auf der Grundlage der Chi-Quadrat-Statistik und der multinomialen Verteilung.
Łukasz Grad
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.