Ein ernstes Problem der Wahrscheinlichkeiten für das Umwerfen von Münzen


10

Nehmen wir an, ich mache 10.000 Münzwürfe. Ich würde gerne wissen, wie wahrscheinlich es ist, wie viele Flips nötig sind, um 4 oder mehr aufeinanderfolgende Köpfe hintereinander zu erhalten.

Die Zählung würde wie folgt funktionieren: Sie würden eine aufeinanderfolgende Runde von Flips als nur Köpfe (4 Köpfe oder mehr) zählen. Wenn ein Schwanz den Kopfstreifen trifft und bricht, beginnt die Zählung ab dem nächsten Flip erneut. Dies würde sich dann für 10.000 Flips wiederholen.

Ich möchte die Wahrscheinlichkeit kennen, dass nicht nur 4 oder mehr Köpfe hintereinander, sondern 6 oder mehr und 10 oder mehr vorhanden sind. Um zu verdeutlichen, ob ein Streifen von 9 Köpfen erreicht wird, wird er als 1 Streifen 4 oder mehr (und / oder 6 oder mehr) und nicht als 2 separate Streifen gewertet. Wenn zum Beispiel die Münze THTHTHTHHHHHH /// THAHTHT .... kam, wäre die Zählung 13 und würde bei den nächsten Schwänzen erneut beginnen.

Nehmen wir an, die Daten sind stark nach rechts verzerrt. Der Mittelwert liegt bei durchschnittlich 40 Flips, um einen Streifen von 4 oder mehr zu erreichen, und die Verteilung ist u = 28. Offensichtlich verzerrt.

Ich gebe mein Bestes, um einen Weg zu finden, aus beschreibenden Daten einen Sinn zu machen, außer bis jetzt habe ich nichts gefunden.

Ich möchte einen Weg finden, eine vernünftige Wahrscheinlichkeit daraus zu ziehen. Wie eine normale Kurve, bei der +/- 1 SD 68% usw. beträgt. Ich habe mich mit der Normalisierung von Protokollen befasst und diese wird nur für parametrische Tests verwendet, die nicht mein Ziel sind.

Mir wurden Beta-Distributionen mitgeteilt, aber jeder Vorschlag, den ich hatte, war ziemlich verwirrend. Ich habe diese Frage vor einem Jahr gestellt und einen Einblick bekommen, aber leider habe ich immer noch keine Antwort. Vielen Dank an alle, die Ideen haben.


Ich sollte wahrscheinlich ein wenig klarstellen. 1) Ich suche nach einem Weg, um beschreibende Daten über die Anzahl aufeinanderfolgender Köpfe über 4 in 1000 Flips (ähnlich einer normalen Kurvenwahrscheinlichkeit von +/- 1 SD = 68%) aus einem verzerrten Datensatz zu verstehen. 2) Empfohlen, eine Beta-Distribution zu verwenden, aber JEDER andere Vorschlag wäre großartig!
Dan

1
Dan, ich habe gerade bemerkt, dass Ihr Beispielsatz für Kopf und Zahl ein "A" enthält.
Glen_b -State Monica

Die von Ihnen vorgenommenen Änderungen sind eine große Verbesserung, aber wir müssen noch einige Änderungen vornehmen. Wo genau sagst du "und die Verteilung ist u = 28"? Sprechen Sie über den Median?
Glen_b -State Monica

@Dan die Beta könnte dieses Problem möglicherweise nur berücksichtigen, wenn Sie einen Bayes'schen Ansatz verwenden und die Wahrscheinlichkeit eines Kopfes schätzen und dann diese Verteilung (und die damit verbundene Unsicherheit) auf das mathematische Ergebnis des von Ihnen angegebenen Problems anwenden.
AdamO

Antworten:


12

Wenn ich richtig verstanden habe, besteht das Problem darin, eine Wahrscheinlichkeitsverteilung für den Zeitpunkt zu finden, zu dem der erste Lauf von oder mehr Köpfen endet.n

Bearbeiten Die Wahrscheinlichkeiten können mithilfe der Matrixmultiplikation genau und schnell bestimmt werden, und es ist auch möglich, den Mittelwert als und die Varianz als analytisch zu berechnen wobei , aber es gibt wahrscheinlich keine einfache geschlossene Form für die Distribution selbst. Ab einer bestimmten Anzahl von Münzwürfen ist die Verteilung im Wesentlichen eine geometrische Verteilung: Es wäre sinnvoll, diese Form für größere .σ 2 = 2 n + 2 ( μ - n - 3 ) - μ 2 + 5 μ μ = μ - + 1 tμ=2n+11σ2=2n+2(μn3)μ2+5μμ=μ+1t

Die zeitliche Entwicklung der Wahrscheinlichkeitsverteilung im Zustandsraum kann unter Verwendung einer Übergangsmatrix für Zustände modelliert werden , wobei die Anzahl aufeinanderfolgender Münzwürfe ist. Die Zustände sind wie folgt:n =k=n+2n=

  • Zustand , keine KöpfeH0
  • Zustand , Köpfe, i 1 i ( n - 1 )Hii1i(n1)
  • Zustand , oder mehr Köpfe nHnn
  • Zustand , oder mehr Köpfe , gefolgt von einem Schwanz nHn

Sobald Sie in den Zustand , können Sie zu keinem der anderen Zustände zurückkehren.H

Die Zustandsübergangswahrscheinlichkeiten, um in die Zustände zu gelangen, sind wie folgt

  • Zustand : Wahrscheinlichkeit von , , dh einschließlich sich selbst, aber nicht Zustand1H0 Hii=0,,n-1Hn12Hii=0,,n1Hn
  • Zustand : Wahrscheinlichkeit von1Hi Hi-112Hi1
  • Zustand : Wahrscheinlichkeit von , dh vom Zustand mit Köpfen und sich selbst1Hn Hn-1,Hnn-112Hn1,Hnn1
  • Zustand : Wahrscheinlichkeit von und Wahrscheinlichkeit 1 von (selbst)1H HnH12HnH

Für ergibt sich beispielsweise die Übergangsmatrixn=4

X={H0H1H2H3H4HH01212121200H11200000H20120000H30012000H400012120H0000121}

Für den Fall , der Anfangsvektor von Wahrscheinlichkeiten ist . Im Allgemeinen hat der Anfangsvektor p p = ( 1 , 0 , 0 , 0 , 0 , 0 ) p i = { 1 i = 0 0 i > 0n=4pp=(1,0,0,0,0,0)

pi={1i=00i>0

Der Vektor ist die Wahrscheinlichkeitsverteilung im Raum für eine bestimmte Zeit. Das erforderliche cdf ist ein cdf in der Zeit und ist die Wahrscheinlichkeit, dass mindestens Münzwürfe zum Zeitpunkt enden . Es kann als , wobei zu beachten ist, dass wir den Zeitschritt 1 nach dem letzten in der Folge aufeinanderfolgender Münzwürfe erreichen. n t ( X t + 1 p ) k H pnt(Xt+1p)kH

Die erforderliche pmf in der Zeit kann geschrieben werden als . Numerisch bedeutet dies jedoch, dass eine sehr kleine Zahl von einer viel größeren Zahl ( ) entfernt wird, und die Genauigkeit wird eingeschränkt. Daher ist es in Berechnungen besser, anstatt 1 zu setzen. Wenn Sie dann für die resultierende Matrix schreiben , ist die pmf . Dies ist , was unten in dem einfachen R - Programm implementiert, die für alle funktioniert ,1 X k , k = 0 X ' X ' = X | X k , k = 0 ( X ' t + 1 p ) k n 2(Xt+1p)k(Xtp)k1Xk,k=0XX=X|Xk,k=0(Xt+1p)kn2

n=4
k=n+2
X=matrix(c(rep(1,n),0,0, # first row
           rep(c(1,rep(0,k)),n-2), # to half-way thru penultimate row
           1,rep(0,k),1,1,rep(0,k-1),1,0), # replace 0 by 2 for cdf
         byrow=T,nrow=k)/2
X

t=10000
pt=rep(0,t) # probability at time t
pv=c(1,rep(0,k-1)) # probability vector
for(i in 1:(t+1)) {
  #pvk=pv[k]; # if calculating via cdf
  pv = X %*% pv;
  #pt[i-1]=pv[k]-pvk # if calculating via cdf
  pt[i-1]=pv[k] # if calculating pmf
}

m=sum((1:t)*pt)
v=sum((1:t)^2*pt)-m^2
c(m, v)

par(mfrow=c(3,1))
plot(pt[1:100],type="l")
plot(pt[10:110],type="l")
plot(pt[1010:1110],type="l")

Das obere Diagramm zeigt die PMF zwischen 0 und 100. Die unteren beiden Diagramme zeigen die PMF zwischen 10 und 110 sowie zwischen 1010 und 1110, was die Selbstähnlichkeit und die Tatsache veranschaulicht, dass die Verteilung, wie @Glen_b sagt, so aussieht, wie sie sein kann angenähert durch eine geometrische Verteilung nach einer Einschwingzeit.

Geben Sie hier die Bildbeschreibung ein

Es ist möglich, dieses Verhalten mithilfe einer Eigenvektorzerlegung von weiter zu untersuchen . Dabei zeigt , dass das für hinreichend große , , wobei ist die Lösung der Gleichung . Diese Annäherung wird mit zunehmendem besser und eignet sich hervorragend für im Bereich von etwa 30 bis 50, abhängig vom Wert von , wie in der nachstehenden Darstellung des Protokollfehlers für die Berechnung von (Regenbogenfarben, rot auf dem links fürXtpt+1c(n)ptc(n)2n+1cn(c1)+1=0ntnp100n=2). (Aus numerischen Gründen wäre es tatsächlich besser, die geometrische Näherung für Wahrscheinlichkeiten zu verwenden, wenn größer ist.)t

Geben Sie hier die Bildbeschreibung ein

Ich vermute (ed), dass möglicherweise eine geschlossene Form für die Verteilung verfügbar ist, da die Mittelwerte und Abweichungen, wie ich sie berechnet habe, wie folgt sind

nMeanVariance2724315144431736563339261271472072556169685112534409102310291201020474151296

(Ich musste die Zahl im Zeithorizont erhöhen, t=100000um dies zu erhalten, aber das Programm lief immer noch für alle in weniger als ungefähr 10 Sekunden.) Die Mittel folgen insbesondere einem sehr offensichtlichen Muster; die Abweichungen weniger. Ich habe in der Vergangenheit ein einfacheres 3-Zustands-Übergangssystem gelöst, aber bisher habe ich kein Glück mit einer einfachen analytischen Lösung für dieses. Vielleicht gibt es eine nützliche Theorie, die mir nicht bekannt ist, z. B. in Bezug auf Übergangsmatrizen.n=2,,10

Bearbeiten : Nach vielen Fehlstarts habe ich mir eine Wiederholungsformel ausgedacht. Sei die Wahrscheinlichkeit, zum Zeitpunkt im Zustand zu sein . Sei die kumulative Wahrscheinlichkeit , sich zum Zeitpunkt im Zustand , dh im Endzustand . NBpi,tHitq,tHt

  • Für jedes gegebene sind und eine Wahrscheinlichkeitsverteilung über den Raum , und unmittelbar darunter verwende ich die Tatsache, dass ihre Wahrscheinlichkeiten zu 1 addieren.tpi,t,0inq,ti
  • p,t bilden eine Wahrscheinlichkeitsverteilung über die Zeit . Später verwende ich diese Tatsache, um die Mittelwerte und Abweichungen abzuleiten.t

Die Wahrscheinlichkeit, zum Zeitpunkt im ersten Zustand zu sein , dh keine Köpfe, ergibt sich aus den Übergangswahrscheinlichkeiten von Zuständen, die ab dem Zeitpunkt (unter Verwendung des Satzes der Gesamtwahrscheinlichkeit). Aber um vom Zustand zu nimmt Stufe, somit und Noch einmal durch den Satz der Gesamtwahrscheinlichkeit die Wahrscheinlichkeit von im Zustandt+1t

p0,t+1=12p0,t+12p1,t+12pn1,t=12i=0n1pi,t=12(1pn,tq,t)
H0Hn1n1pn1,t+n1=12n1p0,t
pn1,t+n=12n(1pn,tq,t)
Hnzum Zeitpunkt ist and unter Verwendung der Tatsache, dass , Ändern Sie daher , t+1
pn,t+1=12pn,t+12pn1,t=12pn,t+12n+1(1pn,tnq,tn)()
q,t+1q,t=12pn,tpn,t=2q,t+12q,t
2q,t+22q,t+1=q,t+1q,t+12n+1(12q,tn+1+q,tn)
tt+n
2q,t+n+23q,t+n+1+q,t+n+12nq,t+112n+1q,t12n+1=0

Diese Wiederholungsformel überprüft die Fälle und . ZB für ergibt ein Diagramm dieser Formel unter Verwendung der Genauigkeit der Maschinenreihenfolge.n=4n=6n=6t=1:994;v=2*q[t+8]-3*q[t+7]+q[t+6]+q[t+1]/2**6-q[t]/2**7-1/2**7

Geben Sie hier die Bildbeschreibung ein

Bearbeiten Ich kann nicht sehen, wohin ich gehen muss, um eine geschlossene Form aus dieser Wiederholungsbeziehung zu finden. Es ist jedoch möglich, eine geschlossene Form für den Mittelwert zu erhalten.

Ausgehend von und unter Hinweis darauf, dass , Nehmen Sie Summen von bis und wenden Sie die Formel für den Mittelwert und notieren Sie, dass ist eine Wahrscheinlichkeitsverteilung gibt ()p,t+1=12pn,t

pn,t+1=12pn,t+12n+1(1pn,tnq,tn)()2n+1(2p,t+n+2p,t+n+1)+2p,t+1=1q,t
t=0E[X]=x=0(1F(x))p,t
2n+1t=0(2p,t+n+2p,t+n+1)+2t=0p,t+1=t=0(1q,t)2n+1(2(112n+1)1)+2=μ2n+1=μ
Dies ist der Mittelwert zum Erreichen des Zustands ; Der Mittelwert für das Ende des Kopflaufs ist eins weniger als dieser.H

Bearbeiten Ein ähnlicher Ansatz unter Verwendung der Formelaus dieser Frage ergibt sich die Varianz. E[X2]=x=0(2x+1)(1F(x))

t=0(2t+1)(2n+1(2p,t+n+2p,t+n+1)+2p,t+1)=t=0(2t+1)(1q,t)2t=0t(2n+1(2p,t+n+2p,t+n+1)+2p,t+1)+μ=σ2+μ22n+2(2(μ(n+2)+12n+1)(μ(n+1)))+4(μ1)+μ=σ2+μ22n+2(2(μ(n+2))(μ(n+1)))+5μ=σ2+μ22n+2(μn3)+5μ=σ2+μ22n+2(μn3)μ2+5μ=σ2

Die Mittelwerte und Abweichungen können leicht programmgesteuert generiert werden. ZB um die Mittelwerte und Abweichungen aus der obigen Tabelle zu überprüfen

n=2:10
m=c(0,2**(n+1))
v=2**(n+2)*(m[n]-n-3) + 5*m[n] - m[n]^2

Schließlich bin ich mir nicht sicher, was Sie wollten, als Sie geschrieben haben

Wenn ein Schwanz den Streifen der Köpfe trifft und bricht, beginnt die Zählung ab dem nächsten Flip erneut.

Wenn Sie gemeint haben, wie hoch die Wahrscheinlichkeitsverteilung für das nächste Mal ist, bei dem der erste Lauf von oder mehr Köpfen endet, dann ist der entscheidende Punkt in diesem Kommentar von @Glen_b enthalten , dh der Prozess beginnt erneut nach einem Schwanz (vgl anfängliches Problem, bei dem Sie sofort einen Lauf von oder mehr Köpfen bekommen könnten ).nn

Dies bedeutet, dass beispielsweise die mittlere Zeit bis zum ersten Ereignis ist, die mittlere Zeit zwischen Ereignissen jedoch immer (die Varianz ist dieselbe). Es ist auch möglich, eine Übergangsmatrix zu verwenden, um die langfristigen Wahrscheinlichkeiten eines Zustands zu untersuchen, nachdem sich das System "beruhigt" hat. Um die entsprechende Übergangsmatrix zu erhalten, setzen Sie und damit das System vom Zustand sofort in den Zustand . Dann gibt der skalierte erste Eigenvektor dieser neuen Matrix die stationären Wahrscheinlichkeiten an . Mit diese stationären Wahrscheinlichkeitenμ1μ+1Xk,k,=0X1,k=1H0Hn=4

probabilityH00.48484848H10.24242424H20.12121212H30.06060606H40.06060606H0.03030303
Die erwartete Zeit zwischen Zuständen wird durch den Kehrwert der Wahrscheinlichkeit angegeben. Die erwartete Zeit zwischen den Besuchen von .H=1/0.03030303=33=μ+1

Anhang : Python-Programm zum Generieren exakter Wahrscheinlichkeiten für n= Anzahl aufeinanderfolgender Heads-Over- NTosses.

import itertools, pylab

def countinlist(n, N):
    count = [0] * N
    sub = 'h'*n+'t'
    for string in itertools.imap(''.join, itertools.product('ht', repeat=N+1)):
        f = string.find(sub)
        if (f>=0):
            f = f + n -1 # don't count t, and index in count from zero 
            count[f] = count[f] +1
            # uncomment the following line to print all matches
            # print "found at", f+1, "in", string
    return count, 1/float((2**(N+1)))

n = 4
N = 24
counts, probperevent = countinlist(n,N)
probs = [count*probperevent for count in counts]

for i in range(N):
    print '{0:2d} {1:.10f}'.format(i+1,probs[i]) 
pylab.title('Probabilities of getting {0} consecutive heads in {1} tosses'.format(n, N))
pylab.xlabel('toss')
pylab.ylabel('probability')
pylab.plot(range(1,(N+1)), probs, 'o')
pylab.show()

7

Ich bin mir nicht sicher, ob die Beta besonders geeignet sein wird, um dieses Problem zu lösen - "Die Anzahl der Spiele bis ..." ist eindeutig eine Zählung. Es ist eine ganze Zahl, und es gibt keine Obergrenze für Werte, bei denen Sie eine positive Wahrscheinlichkeit erhalten.

Im Gegensatz dazu ist die Beta-Verteilung kontinuierlich und in einem begrenzten Intervall, so dass es eine ungewöhnliche Wahl zu sein scheint. Wenn Sie momentan mit einer skalierten Beta übereinstimmen, nähern sich die kumulativen Verteilungsfunktionen möglicherweise nicht so schlecht dem zentralen Teil der Verteilung an. Es ist jedoch wahrscheinlich, dass eine andere Wahl in jedem Schwanz wesentlich besser ist.

Wenn Sie entweder einen Ausdruck für die Wahrscheinlichkeiten oder Simulationen aus der Verteilung haben (die Sie vermutlich benötigen, um ein ungefähres Beta zu finden), warum würden Sie diese nicht direkt verwenden?


Wenn Sie daran interessiert sind, Ausdrücke für Wahrscheinlichkeiten oder die Wahrscheinlichkeitsverteilung der Anzahl der erforderlichen Würfe zu finden, ist es wahrscheinlich die einfachste Idee, mit wahrscheinlichkeitsgenerierenden Funktionen zu arbeiten. Diese sind nützlich, um Funktionen aus rekursiven Beziehungen zwischen Wahrscheinlichkeiten abzuleiten. Diese Funktionen (pgf) ermöglichen es uns wiederum, die von uns benötigten Wahrscheinlichkeiten zu extrahieren.

Hier ist ein Beitrag mit einer guten Antwort auf den algebraischen Ansatz, der sowohl die Schwierigkeiten erklärt als auch pgfs und Wiederholungsrelationen gut nutzt. Es gibt spezifische Ausdrücke für Mittelwert und Varianz im Fall "zwei Erfolge hintereinander":

/math/73758/probability-of-n-successes-in-a-row-at-the-k-th-bernoulli-trial-geometric

Der Fall mit vier Erfolgen wird natürlich wesentlich schwieriger. Andererseits vereinfacht die Dinge etwas.p=12

- -

Wenn Sie nur numerische Antworten wünschen, ist die Simulation relativ einfach. Die Wahrscheinlichkeitsschätzungen könnten direkt verwendet werden, oder es wäre alternativ sinnvoll, die simulierten Wahrscheinlichkeiten zu glätten.

Wenn Sie eine ungefähre Verteilung verwenden müssen, können Sie wahrscheinlich etwas auswählen, das ziemlich gut funktioniert.

Es ist möglich, dass eine Mischung aus negativen Binomen (die Version "Anzahl der Versuche" anstelle der Version "Anzahl der Erfolge") sinnvoll ist. Es ist zu erwarten, dass zwei oder drei Komponenten bis auf den extremen Schwanz eine gute Annäherung ergeben.

Wenn Sie zur Annäherung eine einzelne kontinuierliche Verteilung wünschen, gibt es möglicherweise bessere Optionen als die Beta-Verteilung. es wäre etwas zu untersuchen.


Okay, ich habe seitdem ein wenig Algebra gemacht, einige spielen mit Wiederholungsrelationen, einige Simulationen und sogar ein wenig Nachdenken.

In sehr guter Näherung denke ich, dass Sie es schaffen können, einfach die ersten vier Wahrscheinlichkeiten ungleich Null anzugeben (was einfach ist), die nächsten paar Handvoll Werte durch Wiederholung (auch einfach) zu berechnen und dann einen geometrischen Schwanz zu verwenden, sobald die Wiederholungsrelation vorliegt glättete das anfangs weniger reibungslose Fortschreiten der Wahrscheinlichkeiten.

Es sieht so aus, als könnten Sie den geometrischen Schwanz mit einer sehr hohen Genauigkeit nach k = 20 verwenden. Wenn Sie sich jedoch nur Gedanken über die Genauigkeit von 4 Ziffern machen, können Sie ihn früher einbringen.

Auf diese Weise können Sie PDF und PDF mit guter Genauigkeit berechnen.

Ich bin ein wenig besorgt - meine Berechnungen zeigen, dass die durchschnittliche Anzahl der Würfe 30,0 und die Standardabweichung 27,1 beträgt; Wenn ich verstanden habe, was du mit "x" und "u" meinst, hast du 40 und 28 in deinem Werfen. Die 28 sieht in Ordnung aus, aber die 40 scheint ziemlich weit von dem entfernt zu sein, was ich habe ... was mich beunruhigt, dass ich etwas falsch gemacht habe.

====

HINWEIS: Angesichts der Komplexität zwischen dem ersten und dem folgenden Mal möchte ich nur absolut sicher sein, dass wir jetzt dasselbe zählen.

Hier ist eine kurze Sequenz, bei der die Enden der '4 oder mehr H'-Sequenzen markiert sind (wobei auf die Lücke zwischen den Flips unmittelbar nach dem letzten H hingewiesen wird).

       \/                     \/
TTHHHHHHTTHTTTTTHHTTHTTHHTHHHHHT...
       /\                     /\

Zwischen diesen beiden Markierungen zähle ich 23 Flips; Das heißt, sobald die vorherige Sequenz von (in diesem Fall 6) Hs endet, beginnen wir mit dem Zählen bei dem unmittelbar folgenden T und zählen dann bis zum Ende der Sequenz von 5 Hs (in diesem Fall), die die nächste Sequenz beendet Dies ergibt in diesem Fall eine Zählung von 23.

Zählst du sie so?


Wenn das oben Gesagte richtig ist, sieht die Wahrscheinlichkeitsfunktion der Anzahl der Würfe nach einem Lauf mit mindestens 4 Köpfen so aus, bis der nächste Lauf mit mindestens 4 Köpfen abgeschlossen ist:

Münzprüfer

Auf den ersten Blick sieht es so aus, als ob es für die ersten Werte flach ist und dann einen geometrischen Schwanz hat, aber dieser Eindruck ist nicht ganz genau - es dauert eine Weile, bis man sich zu einem effektiv geometrischen Schwanz entwickelt hat.

Ich arbeite daran, eine geeignete Annäherung zu finden, mit der Sie alle Fragen zu den mit diesem Prozess verbundenen Wahrscheinlichkeiten mit einer guten Genauigkeit beantworten können, die gleichzeitig so einfach wie möglich ist. Ich habe eine ziemlich gute Annäherung, die funktionieren sollte (die ich bereits gegen eine Simulation von einer Milliarde Münzwürfen geprüft habe), aber die Wahrscheinlichkeiten, die die Annäherung in einem Teil des Bereichs angibt, sind etwas (klein, aber konsistent), und ich würde es gerne tun Sehen Sie, ob ich eine zusätzliche Ziffer der Genauigkeit daraus ziehen kann.

Es kann sein, dass der beste Weg, dies zu tun, einfach darin besteht, Ihnen eine Tabelle der Wahrscheinlichkeitsfunktion und cdf bis zu einem Punkt zu geben, ab dem eine geometrische Verteilung verwendet werden kann.

Es wäre jedoch hilfreich, wenn Sie eine Vorstellung davon geben könnten, für welche Bereiche Sie die Näherung verwenden müssen.


Ich hoffe, dass ich den pgf-Ansatz weiterverfolgen kann, aber es ist möglich, dass jemand anderes mit ihnen besser umgehen kann als ich und nicht nur den 4-Fall, sondern auch andere Fälle kann.


Um die Dinge vielleicht weiter zu klären. Ideal wäre eine Verteilung, die die Simulation anpasst oder anpasst, die die Flussrate von 4 erfolgreicheren Köpfen berücksichtigt. Zum Beispiel, wenn der Populatoin-Mittelwert 150 Flips für 4 aufeinanderfolgende Köpfe beträgt. Wenn 4 oder mehr Köpfe beim 8. Flip kamen. Es ist unwahrscheinlich, dass weitere 4 oder mehr Köpfe in weiteren 20 oder so Flips (ich vermute nur) kommen und vielleicht näher am Mittelwert liegen. Etwas, das mir die Wahrscheinlichkeit geben würde, wann seine wahrscheinlichen 4 aufeinanderfolgenden Köpfe innerhalb eines bestimmten Bereichs von Würfen auftreten werden, wäre ERSTAUNLICH.
Dan

Wenn Sie gerade 4 Köpfe hatten und einen fünften Kopf erhalten, zählt dieser letzte 4er-Satz als ein weiterer 4er-Satz oder wird die Zählung zurückgesetzt, sodass Sie erneut mit dem ersten Kopf beginnen (sobald Sie sehen) ein)?
Glen_b -Rate State Monica

(Ich habe bisher angenommen, dass es keine Überlappung gibt, wenn Sie viele Sequenzen von vier erzeugen. Sobald Sie 4 erhalten, wird die Anzahl der S auf 0 zurückgesetzt.)
Glen_b

Es sind 4 Köpfe oder mehr, sobald Sie nach 4 Köpfen einen Schwanz bekommen, hört der Streifen auf. Dann würde die Zählung neu gestartet, bis Sie nacheinander wieder 4 oder mehr Köpfe sehen.
Dan

4 Köpfe oder mehr - ich sehe, das steht tatsächlich in der Frage, ich hatte es einfach nicht ganz richtig verstanden. 9 Köpfe würden also nicht als zwei Lose mit 4 Köpfen zählen. Das ändert die Berechnungen, die ich gemacht habe, total. Die von mir verwendete Wiederholungsrelation ist falsch. Das Grundkonzept - dass es einen geometrischen Schwanz haben sollte - das bleibt jedoch bestehen.
Glen_b -State Monica

0

Sie möchten die geometrische Verteilung . Aus Wikipedia:

Die Wahrscheinlichkeitsverteilung der Anzahl der Bernoulli-Versuche, die für einen Erfolg erforderlich sind, wird auf der Menge {1, 2, 3, ...} unterstützt.X

Lassen Sie Köpfe H ein Misserfolg und Schwänze T ein Erfolg sein. Die Zufallsvariable ist dann die Anzahl der Münzwürfe, die benötigt werden, um die ersten Schwänze zu sehen. Zum Beispiel ist die Sequenz HHHT. Hier ist die Wahrscheinlichkeitsverteilung für :XX=4X

P(X=x)=(1p)x1p

Wir wollen jedoch nur die Anzahl der Köpfe. Definieren wir stattdessen als Anzahl der Köpfe. Hier ist die Verteilung:Y=X1

P(Y+1=x)=(1p)x1pP(Y=x1)=(1p)x1pP(Y=y)=(1p)yp

für . Wir nehmen eine faire Münze an und machen . Deshalb: y=0,1,2,3...p=0.5

P(Y=y)=(0.5)y(0.5)=0.5y+1

Dies alles setzt voraus, dass die Anzahl der Flips ausreichend groß ist (wie 10.000). Für kleineres (endliches) müssten wir dem Ausdruck einen Normalisierungsfaktor hinzufügen . Einfach ausgedrückt müssen wir sicherstellen, dass die Gesamtsumme gleich 1 ist. Wir können dies tun, indem wir durch die Summe aller Wahrscheinlichkeiten dividieren, die hier als definiert sind :nnα

α=i=0n1P(Y=i)

Dies bedeutet, dass die korrigierte Form von mit der Bezeichnung folgt lautet:YZ

P(Z=z)=1α(1p)zp=1i=0n1(1p)ip(1p)zp

Wiederum können wir dies mit mithilfe einer geometrischen Reihen-Summation noch weiter reduzieren :p=0.5

P(Z=z)=1i=0n10.5i+10.5z+1=110.5n0.5z+1=0.5z+110.5n

Und wir können sehen, dass sich unsere modifizierte Version als von früher nähert .nZY


2
Ich denke, es gibt einige Details der Frage, die Sie möglicherweise übersehen haben. Sofern ich die Frage nicht schlecht verstanden habe, ist sie nicht einfach geometrisch.
Glen_b -State Monica

Ich habe es aktualisiert, um endliche n zu behandeln. Und ja, ich sehe jetzt, dass er ein Fenster verschieben wollte, anstatt genau zu zählen. Meins funktioniert nur für Ketten, nicht für die Zeit zwischen ihnen.
Clintonmonk

Ein guter erster Schritt ist es, sich das Diagramm in @ Glen_bs Beitrag anzusehen und zu prüfen, ob Sie das replizieren können. Ich habe auch das Python-Programm hinzugefügt, das ich geschrieben habe, um die genauen Wahrscheinlichkeiten zu überprüfen. Wenn Sie dies ausführen können, kommentieren Sie die Zeile aus, in der Übereinstimmungen gedruckt werden, und verringern Sie sie Nauf 5 bis 7, und Sie erhalten ein gutes Gefühl für die erforderlichen Ereignisse (Hinweis pylabist nur zum Plotten erforderlich).
TooTone

Leider bin ich nicht in der Nähe eines PCs, mit dem ich das derzeit testen kann. Ich fing an, einen Markov-Prozess zu verwenden, um zu zeigen, dass das stationäre Sol'n geometrisch war (und E [Zeit bis zur Rückkehr] = 1 / ), aber ich hatte keine Zeit, es vollständig zu konkretisieren. πi
Clintonmonk

Ja, wenn Sie mit einer stationären Lösung über das Verhältnis aufeinanderfolgender Wahrscheinlichkeiten im Schwanz sprechen, die gegen eine Konstante konvergieren, dann ist die stationäre Lösung tatsächlich geometrisch, wie beide vorherigen Antworten gesagt haben.
Glen_b -State Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.