Überprüfen, ob eine Münze fair ist

Die folgende Frage wurde mir von einem Freund gestellt. Ich konnte ihr nicht helfen, aber ich hoffe, jemand kann es mir erklären. Ich konnte kein ähnliches Beispiel finden. Vielen Dank für Hilfe und Erklärung.

F: Die Ergebnisse von 100 Münzwurfversuchen werden als 0 = "Schwanz" und 1 = "Kopf" aufgezeichnet. Die Ausgabe x ist eine Folge von Nullen und 1 der Länge 100. Und die Häufigkeit, mit der wir 1-0-0 in x erhalten, wird berechnet und beträgt 20 (Beispiel: wenn x = (001001110100), 1-0-0 kommt 2 mal vor). Glaubst du, das ist eine faire Münze?

probability inference bernoulli-distribution

— Jimmy Dur
quelle

Diese Frage klingt nicht nach einem genauen Problem im wirklichen Leben. Ist das Hausaufgaben?

— Sextus Empiricus

Ich bin mir nicht sicher. Wie ich schon sagte, wurde es von einem Freund gefragt. Ich konnte ihr nicht helfen, aber ich möchte immer noch lernen, wie man diese Art von Frage löst oder beantwortet. @ MartijnWeterings

— Jimmy Dur

stats.stackexchange.com/questions/158490/… enthält einen ziemlich vollständigen Bericht über die Situation. Weitere Informationen finden

— whuber

@ JimmyDur hast du keine Ahnung von der Interpretation oder Bedeutung der Frage. Zum Beispiel. Sie formulieren die Frage als "Glauben Sie, dass dies eine faire Münze ist?". Das klingt nach einer Trickfrage.

— Sextus Empiricus

... Unter bestimmten Gesichtspunkten ist dies jedoch möglicherweise nicht der richtige Weg, um dies anzugehen, und man könnte einen Bayes'schen Ansatz wünschen, z. B. wenn man so etwas wie eine vorherige Wahrscheinlichkeitsverteilung der Fairness von Münzen kennt. Ohne Kenntnis des Hintergrunds und der Umstände ist jede Berechnung nur eine mathematische Übung und keine Antwort auf Ihre explizite Frage "Halten Sie das für eine faire Münze?".

— Sextus Empiricus

Problemlösung durch Simulation

Mein erster Versuch wäre, dies auf einem Computer zu simulieren, der viele faire Münzen sehr schnell werfen kann. Unten finden Sie ein Beispiel mit einer Million Versuche. Das Ereignis, dass die Häufigkeit, mit der das Muster '1-0-0' in Münzwürfen auftritt, 20 oder mehr beträgt, tritt ungefähr alle dreitausend Versuche auf, sodass das, was Sie beobachtet haben, nicht sehr wahrscheinlich ist (für eine Messe Münze). $X$ $n=100$

Beachten Sie, dass das Histrogramm für die Simulation vorgesehen ist und die Linie die genaue Berechnung ist, die weiter unten erläutert wird.

set.seed(1)

# number of trials
n <- 10^6

# flip coins
q <- matrix(rbinom(100*n, 1, 0.5),n)

# function to compute number of 100 patterns
npattern <- function(x) {
  sum((1-x[-c(99,100)])*(1-x[-c(1,100)])*x[-c(1,2)])
}

# apply function on data 
counts <- sapply(1:n, function(x) npattern(q[x,]))
hist(counts, freq = 0) 

# estimated probability
sum(counts>=20)/10^6
10^6/sum(counts>=20)

Lösung des Problems mit einer genauen Berechnung

Für einen analytischen Ansatz können Sie die Tatsache verwenden, dass 'die Wahrscheinlichkeit, 20 oder mehr Sequenzen' 1-0-0 'in 100 Münzwürfen zu beobachten, gleich der 1 minus der Wahrscheinlichkeit ist, dass mehr als 100 Flips erforderlich sind, um 20 Sequenzen zu erstellen'. . Dies wird in den folgenden Schritten gelöst:

Wartezeit auf die Wahrscheinlichkeit, dass '1-0-0' umgedreht wird

Die Verteilung der Häufigkeit, mit der Sie umdrehen müssen, bis Sie genau eine Sequenz '1-0-0' erhalten, kann wie folgt berechnet werden: $f_{N,x=1}(n)$

Lassen Sie uns die Wege analysieren, um als Markov-Kette zu '1-0-0' zu gelangen. Wir folgen den Zuständen, die durch das Suffix der Flip-Zeichenfolge beschrieben werden: '1', '1-0' oder '1-0-0'. Wenn Sie beispielsweise die folgenden acht Flips 10101100 haben, haben Sie die folgenden acht Zustände der Reihe nach bestanden: '1', '1-0', '1', '1-0', '1', '1', '1-0', '1-0-0' und es dauerte acht Flips, um '1-0-0' zu erreichen. Beachten Sie, dass Sie nicht bei jedem Flip die gleiche Wahrscheinlichkeit haben, den Status '1-0-0' zu erreichen. Daher können Sie dies nicht als Binomialverteilung modellieren . Stattdessen sollten Sie einem Baum von Wahrscheinlichkeiten folgen. Der Zustand '1' kann in '1' und '1-0' gehen, der Zustand '1-0' kann in '1' und '1-0-0' gehen, und der Zustand '1-0-0' ist ein absorbierender Zustand. Sie können es aufschreiben als:

           number of flips
           1   2   3   4   5   6   7   8   9   ....   n

'1'        1   1   2   3   5   8  13  21  34   ....   F_n
'1-0'      0   1   1   2   3   5   8  13  21          F_{n-1}
'1-0-0'    0   0   1   2   4   7   12 20  33          sum_{x=1}^{n-2} F_{x}

und die Wahrscheinlichkeit, das Muster '1-0-0' zu erreichen, nachdem Sie eine erste '1' gewürfelt haben (Sie beginnen mit dem Zustand '0', ohne einen Kopf umgedreht zu haben), innerhalb von Flips ist das Halbfache der Wahrscheinlichkeit innerhalb von Flips im Zustand '1-0' sein : $n$ $n-1$

f_{N_{c}, x = 1} (n) = \frac{F_{n - 2}}{2^{n - 1}}

$f_{N_c,x=1}(n) = \frac{F_{n-2}}{2^{n-1}}$

wobei die te Fibonnaci-Zahl ist. Die nicht bedingte Wahrscheinlichkeit ist eine Summe $F_i$ $i$

f_{N, x = 1} (n) = \sum_{k = 1}^{n - 2} {0.5}^{k} f_{N_{c}, x = 1} (1 + (n - k)) = {0.5}^{n} \sum_{k = 1}^{n - 2} F_{k}

$f_{N,x=1}(n) = \sum_{k=1}^{n-2} 0.5^{k} f_{N_c,x=1}(1+(n-k)) = 0.5^{n} \sum_{k=1}^{n-2} F_{k}$

Wartezeit auf die Wahrscheinlichkeit, mal '1-0-0' umzudrehen $k$

Dies können Sie durch eine Faltung berechnen.

f_{N, x = k} (n) = \sum_{l = 1}^{n} f_{N, x = 1} (l) f_{N, x = 1} (n - l)

$f_{N,x=k}(n) = \sum_{l=1}^{n} f_{N,x=1}(l)f_{N,x=1}(n-l)$

Sie erhalten die Wahrscheinlichkeit, 20 oder mehr '1-0-0'-Muster zu beobachten (basierend auf der Hypothese, dass die Münze fair ist).

> # exact computation
> 1-Fx[20]
[1] 0.0003247105
> # estimated from simulation
> sum(counts>=20)/10^6
[1] 0.000337

Hier ist der R-Code, um ihn zu berechnen:

# fibonacci numbers
fn <- c(1,1)
for (i in 3:99) {
  fn <- c(fn,fn[i-1]+fn[i-2])
}

# matrix to contain the probabilities
ps <- matrix(rep(0,101*33),33)

# waiting time probabilities to flip one pattern
ps[1,] <- c(0,0,cumsum(fn))/2^(c(1:101))

#convoluting to get the others
for (i in 2:33) {
  for (n in 3:101) {
     for (l in c(1:(n-2))) {
       ps[i,n] = ps[i,n] + ps[1,l]*ps[i-1,n-l]
     }  
  }
}

# cumulative probabilities to get x patterns in n flips
Fx <- 1-rowSums(ps[,1:100])

# probabilities to get x patterns in n flips
fx <- Fx[-1]-Fx[-33]

#plot in the previous histogram
lines(c(1:32)-0.5,fx)

Rechnen nach unfairen Münzen

Wir können die obige Berechnung der Wahrscheinlichkeit, Muster in Flips zu beobachten, verallgemeinern , wenn die Wahrscheinlichkeit von '1 = Kopf' und die Flips unabhängig sind. $x$ $n$ $p$

Wir verwenden nun eine Verallgemeinerung der Fibonacci-Zahlen:

F_{n} (x) = {\begin{cases} 1 & if n = 1 \\ x & if n = 2 \\ x (F_{n - 1} + F_{n - 2}) & if n > 2 \end{cases}

$F_{n}(x) = \begin{cases} 1 & \quad \text{if $n=1$} \\ x & \quad \text{if $n=2$} \\ x(F_{n-1}+ F_{n-2}) & \quad \text{if $n>2$} \end{cases}$

Die Wahrscheinlichkeiten sind jetzt wie folgt:

f_{N_{c}, x = 1, p} (n) = (1 - p)^{n - 1} F_{n - 2} ((1 - p)^{- 1} - 1)

$f_{N_c,x=1,p}(n) = (1-p)^{n-1} F_{n-2}((1-p)^{-1}-1)$

und

f_{N, x = 1, p} (n) = \sum_{k = 1}^{n - 2} p (1 - p)^{k - 1} f_{N_{c}, x = 1, p} (1 + n - k) = p (1 - p)^{n - 1} \sum_{k = 1}^{n - 2} F_{k} ((1 - p)^{- 1} - 1)

$f_{N,x=1,p}(n) = \sum_{k=1}^{n-2} p(1-p)^{k-1} f_{N_c,x=1,p}(1+n-k) = p(1-p)^{n-1}\sum_{k=1}^{n-2} F_{k}((1-p)^{-1}-1)$

Wenn wir dies planen, erhalten Sie:

Während der p-Wert für eine faire Münze 0,0003247 klein ist, müssen wir beachten, dass er für verschiedene unfaire Münzen nicht viel besser ist (nur eine einzige Bestellung). Das Likelihood-Verhältnis oder der Bayes-Faktor liegt bei 11, wenn die Nullhypothese ( ) mit der Alternativhypothese verglichen wird . Dies bedeutet, dass das hintere Quotenverhältnis nur zehnmal höher ist als das vorherige Quotenverhältnis. $p=0.5$ $p=0.33$

Wenn Sie also vor dem Experiment dachten, dass die Münze unwahrscheinlich unfair ist, sollten Sie jetzt immer noch denken, dass die Münze unwahrscheinlich unfair ist.

Eine Münze mit aber Ungerechtigkeit in Bezug auf '1-0-0' Vorkommen $p_{heads} = p_{tails}$

Man könnte die Wahrscheinlichkeit für eine faire Münze viel einfacher testen, indem man die Anzahl der Köpfe und Schwänze zählt und eine Binomialverteilung verwendet, um diese Beobachtungen zu modellieren und zu testen, ob die Beobachtung spezifisch ist oder nicht.

Es kann jedoch sein, dass die Münze im Durchschnitt die gleiche Anzahl von Kopf und Zahl wirft, aber in Bezug auf bestimmte Muster nicht fair ist. Zum Beispiel könnte die Münze eine gewisse Korrelation für nachfolgende Münzwürfe haben (ich stelle mir einen Mechanismus mit Hohlräumen im Metall der Münze vor, die mit Sand gefüllt sind, der wie eine Sanduhr zum entgegengesetzten Ende des vorherigen Münzwurfs fließt, der die Münze lädt wahrscheinlicher auf die gleiche Seite wie die vorherige Seite fallen).

Der erste Münzwurf sei mit gleicher Wahrscheinlichkeit Kopf und Zahl, und nachfolgende Würfe sind mit der Wahrscheinlichkeit dieselbe Seite wie der vorherige Wurf. Dann ergibt eine ähnliche Simulation wie zu Beginn dieses Beitrags die folgenden Wahrscheinlichkeiten für die Häufigkeit, mit der das Muster '1-0-0' 20 überschreitet: $p$

Sie können sehen, dass es möglich ist, die Wahrscheinlichkeit, das 1-0-0-Muster zu beobachten (etwas um eine Münze, die eine negative Korrelation aufweist), etwas wahrscheinlicher zu machen , aber dramatischer ist, dass man es viel weniger machen kann wahrscheinlich oberhalb des '1-0-0'-Musters. Bei niedrigem Sie ein Vielfaches der Schwänze nach einem Kopf, dem ersten '1-0'-Teil des' 1-0-0'-Musters, aber Sie erhalten nicht so oft zwei Schwänze hintereinander, das '0-0'. Teil des Musters. Das Gegenteil gilt für die hohen Werte. $p=0.45$ $p$ $p$

# number of trials
set.seed(1)
n <- 10^6

p <- seq(0.3,0.6,0.02)
np <- length(p)
mcounts <- matrix(rep(0,33*np),33)

pb <- txtProgressBar(title = "progress bar", min = 0,
                     max = np, style=3)
for (i in 1:np) {
  # flip first coins
  qfirst <- matrix(rbinom(n, 1, 0.5),n)*2-1
  # flip the changes of the sign of the coin
  qrest <- matrix(rbinom(99*n, 1, p[i]),n)*2-1
  # determining the sign of the coins
  qprod <- t(sapply(1:n, function(x) qfirst[x]*cumprod(qrest[x,])))
  # representing in terms of 1s and 0s
  qcoins <- cbind(qfirst,qprod)*0.5+0.5
  counts <- sapply(1:n, function(x) npattern(qcoins[x,]))

  mcounts[,i] <- sapply(1:33, function(x) sum(counts==x))
  setTxtProgressBar(pb, i)
}
close(pb)

plot(p,colSums(mcounts[c(20:33),]),
     type="l", xlab="p same flip", ylab="counts/million trials", 
     main="observation of 20 or more times '1-0-0' pattern \n for coin with correlated flips")
points(p,colSums(mcounts[c(20:33),]))

Verwendung der Mathematik in der Statistik

Das obige ist alles in Ordnung, aber es ist keine direkte Antwort auf die Frage

"Glaubst du, das ist eine faire Münze?"

Um diese Frage zu beantworten, kann man die obige Mathematik verwenden, aber man sollte zuerst die Situation, die Ziele, die Definition von Fairness usw. sehr gut beschreiben. Ohne Kenntnis des Hintergrunds und der Umstände ist jede Berechnung nur eine mathematische Übung und keine Antwort darauf die explizite Frage.

Eine offene Frage ist, warum und wie wir nach dem Muster '1-0-0' suchen.

Zum Beispiel war dieses Muster möglicherweise kein Ziel, über das vor der Untersuchung entschieden wurde. Vielleicht war es nur etwas, das in den Daten "auffiel", und es war etwas, das nach dem Experiment Aufmerksamkeit erregte . In diesem Fall muss man berücksichtigen, dass man effektiv mehrere Vergleiche durchführt .
Ein weiteres Problem ist, dass die oben berechnete Wahrscheinlichkeit ein p-Wert ist. Die Bedeutung eines p-Wertes muss sorgfältig abgewogen werden. Es ist nicht die Wahrscheinlichkeit, dass die Münze fair ist. Es ist stattdessen die Wahrscheinlichkeit, ein bestimmtes Ergebnis zu beobachten, wenn die Münze fair ist. Wenn man ein Umfeld hat, in dem man eine gewisse Verteilung der Fairness von Münzen kennt oder eine vernünftige Annahme treffen kann, kann man dies berücksichtigen und einen Bayes'schen Ausdruck verwenden .
Was ist fair, was ist unfair. Bei genügend Versuchen kann man schließlich ein kleines bisschen Ungerechtigkeit finden. Aber ist es relevant und ist eine solche Suche nicht voreingenommen? Wenn wir uns an einen frequentistischen Ansatz halten, sollte man so etwas wie eine Grenze beschreiben, über der wir eine Münzmesse betrachten (einige relevante Effektgrößen). Dann könnte man etwas Ähnliches wie den zweiseitigen T-Test verwenden, um zu entscheiden, ob die Münze fair ist oder nicht (in Bezug auf das '1-0-0'-Muster).

— Sextus Empiricus
quelle

Warum nicht eine geschlossene Lösung über MLE verfolgen?

— Digio

Ich bin nur neugierig. Wäre nicht mit und einem Konfidenzintervall für eine gültige Antwort geben, @whuber?

{\hat{p}}_{M L} = a r g m a x_{p} [P (X_{1}, . . ., X_{n} | p, n)]

$\hat{p}_{ML} = argmax_p [P(X_1,...,X_n | p, n)]$

X \sim B i n o m i a l (n, p)

$X \sim Binomial(n, p)$

{\hat{p}}_{M L}

$\hat{p}_{ML}$

— Digio

Vielen Dank für diese gründliche Antwort Martijn, ich mag den zweiten Ansatz wirklich. Meine Gedanken waren im Sinne einer direkteren Lösung: Schätzen Sie als Parameter eines einzelnen Binomials oder mehrerer Bernoulli-Verteilungen. Wenn das Konfidenzintervall der Wahrscheinlichkeit nicht 0,5 enthält, würden wir sagen, dass die Münze voreingenommen ist.

p

$p$

p

$p$

— Digio

Zum Beispiel erhalten wir für mit einer Fehlerquote von . Und da , können wir schließen, dass die Münze nicht voreingenommen ist (bei einem Signifikanzniveau von 5%).

X = {0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0}

$X=\{0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0\}$

\hat{p} = \frac{x}{n} = \frac{5}{12} = 0.42

$\hat{p} = {{x}\over{n}}={5 \over 12}=0.42$

1.96 \sqrt{\frac{\hat{p} (1 - \hat{p})}{n}} = 0.28

$1.96 \sqrt{\hat{p}(1-\hat{p}) \over {n}} = 0.28$

0.42 + 0.28 < 0.50

$0.42+0.28 < 0.50$

— Digio

@FrankHarrell Es gibt auch nichts im Problem-Setup, was uns denken lässt, dass die Flips nicht korreliert sind. Das Problem-Setup ist mit Informationen relativ schlecht. Mein Beispiel, das sich mit der Korrelation von Flips befasst, dient nur dazu, die Breite der Frage abzudecken. Ich sage nicht , dass dies ist die Art und Weise , sie zu beantworten. Angenommen, jemand (möglicherweise das OP) erforscht DNA-Sequenzen oder andere Probleme, bei denen die Möglichkeit einer Korrelation sinnvoller ist, und hat dann ein Beispiel dafür, wie sich dies herausstellen könnte.

— Sextus Empiricus

Überprüfen, ob eine Münze fair ist

Problemlösung durch Simulation

Lösung des Problems mit einer genauen Berechnung

Wartezeit auf die Wahrscheinlichkeit, dass '1-0-0' umgedreht wird

Wartezeit auf die Wahrscheinlichkeit, mal '1-0-0' umzudrehenkkk

Rechnen nach unfairen Münzen

Eine Münze mit aber Ungerechtigkeit in Bezug auf '1-0-0' Vorkommenpheads=ptailspheads=ptailsp_{heads} = p_{tails}

Verwendung der Mathematik in der Statistik

Wartezeit auf die Wahrscheinlichkeit, mal '1-0-0' umzudrehen $k$

Eine Münze mit aber Ungerechtigkeit in Bezug auf '1-0-0' Vorkommen $p_{heads} = p_{tails}$