Statistikkonzept, um zu erklären, warum es weniger wahrscheinlich ist, dass Sie die gleiche Anzahl von Köpfen und Schwänzen umdrehen, wenn die Anzahl der Umdrehungen zunimmt?


28

Ich arbeite daran, Wahrscheinlichkeit und Statistik zu lernen, indem ich ein paar Bücher lese und Code schreibe, und während ich Münzwürfe simuliere, bemerke ich etwas, das meiner naiven Intuition leicht widerspricht. Wenn Sie mal eine faire Münze werfen, konvergiert das Verhältnis von Kopf zu Zahl gegen 1, wenn zunimmt, genau wie Sie es erwarten würden. Andererseits scheint es mit zunehmendem weniger wahrscheinlich zu sein , dass Sie genau die gleiche Anzahl von Köpfen und Schwänzen umdrehen, wodurch Sie ein Verhältnis von genau 1 erhalten.nnn

Zum Beispiel (einige Ausgaben aus meinem Programm)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

Meine Frage lautet: Gibt es ein Konzept / Prinzip in der Statistik / Wahrscheinlichkeitstheorie, das dies erklärt? Wenn ja, um welches Prinzip / Konzept handelt es sich?

Link zum Code, wenn jemand daran interessiert ist, wie ich das generiert habe.

- bearbeiten -

Für das, was es wert ist, hier ist, wie ich mir das vorher erklärt habe. Wenn Sie eine faire Münze mal und die Anzahl der Köpfe zählen, generieren Sie im Grunde genommen eine Zufallszahl. Wenn Sie dasselbe tun und die Schwänze zählen, generieren Sie ebenfalls eine Zufallszahl. Wenn Sie also beide zählen, erzeugen Sie zwei Zufallszahlen, und wenn größer wird, werden die Zufallszahlen größer. Und je größer die von Ihnen generierten Zufallszahlen sind, desto größer ist die Wahrscheinlichkeit, dass sie sich gegenseitig "verfehlen". Was dies interessant macht, ist, dass die beiden Zahlen tatsächlich in gewisser Weise miteinander verbunden sind, wobei ihr Verhältnis mit zunehmender Größe gegen eins konvergiert, obwohl jede Zahl für sich zufällig ist. Vielleicht bin es nur ich, aber ich finde das nett. nnn


Suchen Sie intuitive oder mathematische Erklärungen?
Glen_b

1
Wirklich beides. Ich glaube , ich irgendwie verstehe den Grund in einem intuitiven Sinne, aber ich mag die formale Argumentation dahinter verstehen.
Geisteskriminalität

1
Wissen Sie, wie man Binomialwahrscheinlichkeiten berechnet und auf diese Situation anwendet? Wenn nicht, schauen Sie nach und berechnen Sie die Berechnungen.
Mark L. Stone

Wow, es gibt mehrere gute Antworten auf diese Frage. Ich fühle mich schlecht, wenn ich den einen akzeptieren muss und nicht den anderen. Lassen Sie mich nur sagen, dass ich alle Antworten und alle, die sich die Zeit genommen haben, um ihre Einsichten zu teilen, zu schätzen weiß.
Geisteskriminalität

Antworten:


31

Beachten Sie, dass der Fall, in dem die Anzahl der Köpfe und die Anzahl der Schwänze gleich ist, mit "genau der Hälfte der Zeit, in der Sie Köpfe erhalten" identisch ist. Also bleiben wir beim Zählen der Anzahl der Köpfe, um zu sehen, ob es sich um die Hälfte der Anzahl der Würfe handelt, oder vergleichen wir den Anteil der Köpfe gleichwertig mit 0,5.

Je mehr Sie drehen, desto größer ist die Anzahl der möglichen Köpfe, die Sie haben können - die Verteilung wird breiter (z. B. wird ein Intervall für die Anzahl der Köpfe, die 95% der Wahrscheinlichkeit enthalten, größer, wenn die Anzahl der Würfe zunimmt). Die Wahrscheinlichkeit, dass genau ein halber Kopf auftaucht, sinkt, wenn wir mehr werfen.

Entsprechend nimmt der Anteil der Köpfe mehr mögliche Werte an; siehe hier, wo wir von 100 auf 200 Würfe wechseln:

Bildbeschreibung hier eingeben

Mit 100 Würfen können wir einen Anteil von 0,49 Köpfen oder 0,50 Köpfen oder 0,50 Köpfen (und so weiter - aber nichts dazwischen) beobachten, aber mit 200 Würfen können wir 0,49 oder 0,495 oder 0,50 oder 0,505 oder 0,50 - beobachten Wahrscheinlichkeit hat mehr Werte zu "decken" und so wird jeder tendenziell einen kleineren Anteil bekommen.

Bedenken Sie, dass Sie Würfe mit einer gewissen Wahrscheinlichkeit p i haben , i Köpfe zu bekommen (wir kennen diese Wahrscheinlichkeiten, aber es ist für diesen Teil nicht kritisch), und fügen Sie zwei weitere Würfe hinzu. In 2 n Würfen ist n Köpfe das wahrscheinlichste Ergebnis ( p n > p n ± 1 und es geht von dort abwärts).2npichich2nnpn>pn±1

Was ist die Chance, Köpfe in 2 n + 2 Würfen zu haben?n+12n+2

(Beschriften Sie diese Wahrscheinlichkeiten mit damit wir sie nicht mit den vorherigen verwechseln. Lassen Sie auch P (HH) die Wahrscheinlichkeit von "Kopf, Kopf" in den nächsten zwei Würfen usw. sein.)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

dh wenn Sie zwei weitere Münzwürfe addieren, sinkt die Wahrscheinlichkeit des Mittelwerts natürlich, weil er den wahrscheinlichsten (mittleren) Wert mit dem Durchschnitt der kleineren Werte auf beiden Seiten mittelt.

Also, solange Sie bequem , dass die Spitze in der Mitte sein wird (für ), Die Wahrscheinlichkeit , genau die Hälfte Köpfe muß abnehmen , wenn n nach oben geht.2n=2,4,6,...n


In der Tat können wir zeigen , dass für große , p n nimmt proportional mit 1npn (nicht überraschend, da sich die Verteilung der standardisierten Anzahl von Köpfen der Normalität nähert und die Varianz des Anteils von Köpfen mitnabnimmt).1nn


Wie angefordert, ist hier der R-Code, der etwas in der Nähe des obigen Diagramms erzeugt:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

1
Ich stimme mit @RustyStatistician in Bezug auf die 1000-Wörter-Genauigkeit Ihrer Grafik überein. Zusätzliches Guthaben für den Zeiger auf den Code.
TomRoche

Tolle Figur und Erklärung!

@ Tom Ich habe Code eingefügt, der alles macht, außer die "200" im Titel grün zu machen.
Glen_b

1
@ Glen_b Vielen Dank für einen weiteren tollen Beitrag und die Großzügigkeit, die Codezeilen zu teilen. Schönes Grundstück! Es ist schwer zuzugeben, aber ich habe Probleme mit dem mathematischen Ausdruck des Konzepts in Ihrem Beitrag und insbesondere mit der Verwendung von Großbuchstaben . P
Antoni Parellada

1
@Antoni bedeutet einfach "Wahrscheinlichkeit, bei den zwei zusätzlichen Würfen" Kopf, Kopf "zu bekommen". Um n + 1 Köpfe in 2n + 2 Würfen zu erhalten, müssen Sie bei 2n Würfen entweder n-1 Köpfe (und dann 2 Köpfe geworfen) oder n Köpfe (und dann 1 Kopf geworfen) oder n + 1 Kopf (und dann geworfen) haben 0 Köpfe). P(HH)
Glen_b

19

Nun, wir wissen, dass das Gesetz der großen Zahlen die erste Schlussfolgerung Ihres Experiments garantiert, nämlich dass, wenn Sie mal eine faire Münze werfen , das Verhältnis von Kopf zu Zahl zu 1 konvergiert, wenn n zunimmt. nn

Also keine Probleme da. Das sagt uns in diesem Szenario jedoch alles über das Gesetz der großen Zahlen.

Aber denken Sie jetzt intuitiver über dieses Problem nach. Denken Sie daran, eine Münze ein paar Mal zu werfen, zum Beispiel: .n=2,4,8,10

Wenn Sie eine Münze zweimal werfen, dh , denken Sie an die möglichen Szenarien der beiden Flips. (Hier bezeichnet H Köpfe und T Schwänze). Auf dem ersten Flip hättest du H bekommen können und auf dem zweiten Flip hättest du T bekommen können . Aber das ist nur eine Möglichkeit, wie die beiden Flips hätten kommen können. Sie hätten auch am ersten Flip T und am zweiten Flip H und allen anderen möglichen Kombinationen bekommen können. Am Ende des Tages, wenn Sie 2 Münzen werfen, sind die möglichen Kombinationen, die Sie auf den beiden Flips sehen können, S = { H H , H T ,n=2HTHTTH und so gibt es 4 mögliche Szenarien für das Umwerfen von n = 2 Münzen.

S={HH,HT,TH,TT}
n=2

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

n=8

n=10

n2n

n=2

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

n

n

Pr(Ratio of exactly 1)0

Und so, um deine Frage zu beantworten. Wirklich, was Sie beobachten, ist nur eine Folge der Tatsache, dass es viel mehr Kombinationen von Münzwürfen geben wird, bei denen die Anzahl der Köpfe und Schwänze nicht gleich ist, verglichen mit der Anzahl der Kombinationen, bei denen sie gleich sind.



Wenn Sie mit der Binomialformel und den binomialen Zufallsvariablen vertraut sind, können Sie, wie @Mark L. Stone vorschlägt, dasselbe Argument verwenden.

Lassen X Die Anzahl der Köpfe, die beim Werfen einer fairen Münze aufgezeichnet wurden n times. we can regard X as a random variable coming from a binomial distribution, i.e., XBin(n,p=0.5) (here we assume p=0.5 because we are dealing with a fair coin) then the probability of getting exactly the same number of heads as the number of tails (i.e., a ratio of exactly 1) is

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

Now, once again, as n tends to grow large, the above expression tends towards 0 because (nn/2)0.5n0 as n.


2
You need to say a bit more than that 0.5n0 as n ... you also need to say something about the (nn/2) as well. (For comparison: just because 0.5n0, doesn't mean n!0.5n0).
Silverfish

@Glen_b I don't have enough points to comment on your post, but awesome graphic!

Thanks @RustyStatistician, that helps a lot. The first part of your explanation pretty much matches the way I was thinking of it, but I am not quite far enough along with my stats yet to know how to work it out using the Binomial distribution. I basically read over my book once, not working out problems or anything, and now I'm going back through from the beginning, and writing code to explore various aspects of the material.
mindcrime

@mindcrime sounds great! Glad I could help.

5

See Pascal's Triangle.

The likelihood of coin flip outcomes is represented by the numbers along the bottom row. The outcome of equal heads and tails is the middle number. As the tree grows larger (i.e., more flips), the middle number becomes a smaller proportion of the sum of the bottom row.



1

While the ratio of heads to tails converges to 1, the range of possible numbers becomes wider. (I'm making the numbers up). Say for 100 throws the probability is 90% that you have between 45% and 55% heads. That's 90% that you get 45 to 55 heads. 11 possibilities for the number of heads. About 9% roughly that you get equal numbers of heads and tails.

Say for 10,000 throws the probability is 95% that you get between 49% and 51% heads. So the ratio has come a lot closer to 1. But now you have between 4,900 and 5,100 heads. 201 possibilities. Chance of equal numbers is only roughly about 0.5%.

And with a million throws you are quite sure to have between 49.9% and 50.1% heads. That's a range from 499,000 to 501,000 heads. 2,001 possibilities. The chance is now down to 0.05%.

Ok, the maths was made up. But this should give you an idea about the "why". Even though the ratio comes closer to 1, the number of possibilities becomes greater, so that hitting exactly half head, half tails, becomes less and less likely.

Another practical effect: It is unlikely in practice that you have a coin where the probability of throwing heads is exactly 50%. It might be 49.99371% if you have a really good coin. For small number of throws this doesn't make a difference. For large numbers, the percentage of heads will converge to 49.99371%, not 50%. If the number of throws is large enough, throwing 50% or more heads will become very, very unlikely.


0

Nun, eine Sache, die zu beachten ist, ist, dass bei einer geraden Anzahl von Flips (andernfalls ist die Wahrscheinlichkeit, dass Kopf- und Schwanzflips gleich sind, natürlich genau Null), das wahrscheinlichste Ergebnis immer das mit genau so vielen Kopfflips wie Schwanzflips sein wird.

Die Verteilung von n Flips sind durch die Koeffizienten des Polynoms gegeben

(1+x2)n.
Also für einmal nist die Wahrscheinlichkeit
pn=2-n(nn/2).

Unter Verwendung von Stirlings Näherung für n!Sie kommen zu etwas wie

p1πn/2
für die Wahrscheinlichkeit genau n/2 Köpfe (und entsprechend Schwänze) schlagen nach n overall flips. So the absolute probability of this outcome converges to 0 but much slower than most of the other outcomes, with the extreme cases of 0 heads (or alternatively 0 tails) flips being 2n.

2
Your answer could be improved by carefully defining quantities in your expressions. What is n? What is p?
Sycorax sagt Reinstate Monica

0

Suppose you flip a coin twice. There are four possible outcomes: HH, HT, TH, and TT. In two of these, you have an equal number of heads and tails, so there's a 50% chance that you get the same number of heads and tails.

Now suppose you flip a coin 4,306,492,102 times. Do you expect a 50 percent chance that you'll wind up with exactly 2,153,246,051 heads and 2,153,246,051 tails?


No, my intuition told me that the chances of getting an exact match were low, just because the numbers were getting larger. But I wanted to simulate it just to confirm my thought. When I saw that it turned out that way, I was intrigued as to the formal reasoning behind why it is that way. It strikes me as interesting that the resulting ratio is converging towards 1 while simultaneously becoming less likely to be exactly 1.
mindcrime

3
One way of thinking about that is that for large n there are many more ways to be close to 50-50 than there are for small n.
Daniel McLaury
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.