Ändert sich die Wahrscheinlichkeitsverteilung einer Urne, wenn Sie im Durchschnitt ersatzlos daraus ziehen?


9

Angenommen, ich habe eine Urne mit N verschiedenen Farben von Kugeln und jede andere Farbe kann unterschiedlich oft erscheinen (wenn 10 rote Kugeln vorhanden sind, müssen nicht auch 10 blaue Kugeln vorhanden sein). Wenn wir den genauen Inhalt der Urne vor dem Zeichnen kennen, können wir eine diskrete Wahrscheinlichkeitsverteilung bilden, die uns die Wahrscheinlichkeit angibt, mit der jede Farbe der Kugel gezeichnet wird. Ich frage mich, wie sich die Verteilung nach dem Ziehen von k Bällen ohne Ersatz aus der Urne im Durchschnitt ändert. Ich verstehe, dass wir, wenn wir aus der Urne ziehen, die Verteilung mit dem Wissen darüber aktualisieren können, was herausgenommen wurde, aber ich möchte wissen, wie wir die Form der Verteilung erwarten würden, nachdem wir k Kugeln entfernt haben. Ändert sich die Verteilung im Durchschnitt oder bleibt sie gleich? Wenn es nicht gleich bleibt, können wir eine Formel aufschreiben, wie die neue Verteilung nach k Draws im Durchschnitt aussehen soll?


1
Ich könnte mich irren - aber das fühlt sich so an, als ob man die vorherige Verteilung kennt, aber keine Informationen über die Wahrscheinlichkeit hat (abgesehen davon, dass k Bälle entfernt werden). in diesem Fall würde ich annehmen, dass der hintere Teil dem vorherigen entspricht. Um fair zu sein - es gibt Wahrscheinlichkeitsinformationen, dass die Anzahl der Bälle abgenommen hat und dass (für einen entfernten Ball) die Verteilung daher z. B. bimodal zwischen 50% Möglichkeit von 9 Rot und 10 Schwarz und 50% Möglichkeit von 10 Rot und 9 Schwarz ist . Ich kann hier allerdings falsch liegen
Wouter

Meine Intuition ist, dass es wie der letztere Fall ist, den Sie beschrieben haben. Ich kann jedoch niemanden finden, der über diese Art von Prozess spricht.
Mjnichol

Antworten:


7
  1. "Direkte Berechnung": In der Urne befinden sich Kugeln mit Farben. Konzentrieren wir uns auf die Wahrscheinlichkeit , beim zweiten Zeichnen eine bestimmte Farbe, z. B. Weiß , zu zeichnen. Die Anzahl der weißen Kugeln sei . Sei die Farbe der Kugel, die beim ten Zug erhalten wird.m n w X i inmnwXii

    P(X2=W)=P(X2=W|X1=W)P(X1=W)+P(X2=W|X1=W¯)P(X1=W¯)=nw1n1nwn+nwn1nnwn=nw(nnw+nw1)n(n1)=nwn=P(X1=W)

    Natürlich gilt das gleiche Argument für jede Farbe bei der zweiten Ziehung. Wir können dieselbe Art von Argument rekursiv anwenden, wenn wir spätere Ziehungen betrachten.

    [Man könnte natürlich eine noch direktere Berechnung durchführen. Betrachten Sie die ersten Ziehungen als bestehend aus weißen Kugeln und nicht weißen Kugeln (mit der Wahrscheinlichkeit, die durch die hypergeometrische Verteilung gegeben ist), und führen Sie die entsprechende Berechnung wie oben beschrieben durch, jedoch für die Ziehung in Schritt ; man bekommt eine ähnliche Vereinfachung und Annullierung, aber es ist nicht besonders aufschlussreich, sie durchzuführen.]i k - i k + 1kikik+1

  2. Ein kürzeres Argument: Beschriften Sie die Kugeln nach dem Zufallsprinzip mit den Zahlen und ziehen Sie sie dann in der angegebenen Reihenfolge heraus. Die Frage lautet nun: "Ist die Wahrscheinlichkeit, dass ein gegebenes Etikett auf einer weißen Kugel platziert wird, dieselbe wie die Wahrscheinlichkeit, dass das Etikett auf einer weißen Kugel platziert wird?"k 11,2,...,nk1

    Jetzt sehen wir, dass die Antwort aufgrund der Symmetrie der Etiketten "Ja" sein muss. In ähnlicher Weise spielt es aufgrund der Symmetrie der Kugelfarben keine Rolle, dass wir "Weiß" sagten, so dass das Argument, dass Label und Label die gleiche Wahrscheinlichkeit haben, für jede Farbe gilt. Daher ist die Verteilung bei der ten Ziehung dieselbe wie bei der ersten Ziehung, solange wir keine zusätzlichen Informationen aus den früheren Ziehungen haben (dh solange die früher gezogenen Bälle nicht gesehen werden).1 kk1k


Eng verwandt mit Ihrem zweiten Weg ist ein weiteres kurzes Argument: Stellen Sie sich die Menge aller möglichen Sequenzen vor, in denen die Kugeln entfernt werden können (z. B. zuerst blau, dann weiß, dann weiß, ... könnte eine solche Sequenz sein). Wenn wir für jede Sequenz in dieser Menge die Elemente und tauschen , permutieren wir einfach die Menge. Für jede Sequenz mit einer weißen (oder was auch immer) Kugel in Position gibt es genau eine entsprechende Sequenz mit einer weißen Kugel in Position . Daher muss die Wahrscheinlichkeit einer weißen Kugel in Position oder Position gleich sein. Ich denke, das ist im Wesentlichen Neils Argument. k t h k 1 k 11stkthk1k1
Silverfish

@Silverfish Ja, mein zweites Argument ist im Wesentlichen das gleiche Argument wie Neils Permutationsargument.
Glen_b -State Monica

Danke für die Erklärung. Es war genau das, was ich sehen musste!
mjnichol

6

Der einzige Grund, warum es nicht ganz offensichtlich ist, dass die Verteilung unverändert bleibt (vorausgesetzt, mindestens eine Kugel bleibt übrig), ist, dass zu viele Informationen vorhanden sind. Lassen Sie uns das ablenkende Material entfernen.

Ignorieren Sie für einen Moment die Farbe jeder Kugel. Konzentriere dich auf einen Ball. Angenommen, Bälle werden zufällig entfernt (und nicht beobachtet), und dann wird ein Ball gezogen und beobachtet. Es spielt keine Rolle, in welcher Reihenfolge die Auswahl erfolgt. Sie können also auch den ersten gezogenen Ball beobachten (und dann weitere Bälle entfernen , wenn Sie darauf bestehen). Die Verteilung hat sich offensichtlich nicht geändert, da sie durch das Entfernen der anderen Kugeln nicht beeinflusst wird .k + 1 k kkk+1kk


Dieses Argument - obwohl es durchaus gültig ist - könnte dazu führen, dass sich manche Menschen unwohl fühlen. Die folgende Analyse wird möglicherweise als strenger akzeptiert, da wir nicht aufgefordert werden, die Auswahlreihenfolge zu ignorieren.

Konzentriere dich weiter auf deinen Ball. Es wird eine gewisse Wahrscheinlichkeit , als Ball ausgewählt zu werden. Obwohl einfach zu berechnen ist, müssen wir seinen Wert nicht kennen: Alles, was zählt, ist, dass es für jeden Ball der gleiche Wert sein muss (weil alle Bälle gleich sind) und dass er ungleich Null ist. Wenn es jedoch Null wäre, hätte kein Ball eine Wahrscheinlichkeit, ausgewählt zu werden: Solange mindestens ein Ball übrig bleibt, ist . k + 1 p k p k0pkk+1pkpk0

Achten Sie wieder auf die Farben. Per Definition ist die Chance, dass eine bestimmte Farbe ausgewählt wird (nachdem Bälle zufällig entfernt wurden), die Summe der Chancen aller ursprünglichen farbigen Bälle geteilt durch die Summe der Chancen aller ursprünglichen Bälle. Wenn es ursprünglich Kugeln der Farbe und insgesamt Kugeln gibt, ist dieser Wertk C k C C nCkCkCCn

Prk(C)=kcpknpk=kcn.

Wenn , hängt es nicht von , QED ab .k<nk


Danke für den Kommentar. Es hat mir geholfen, die zugrunde liegenden Prozesse besser zu verstehen!
mjnichol

2

Lassen Sie die Verteilung des Zeichnens einer einzelnen Kugel - nachdem Sie bereits Bälle ohne Ersatz gezogen haben - eine kategoriale Verteilung wenn die Verteilung über solche kategorialen Verteilungen .kE(Dk)Dk

Ich denke, Sie fragen, ob konstant ist.E(Dk)

Ich halte es für. Angenommen, Sie ziehen schließlich alle Kugeln. Alle Permutationen der Kugeln sind gleich wahrscheinlich. Die Wahrscheinlichkeit des Zeichnens beträgt zunächst . Sie können Ihre Auswahl auf eine ebenso wahrscheinliche Permutation umstellen, bei der Ihr zuerst gewählter Ball zuletzt und Ihr zweiter gewählter zuerst ausgewählt wurde. Dieser Ball hat die Erwartung , die aufgrund der Symmetrie gleich muss . Durch Induktion sind alle gleich.E(D0)E(D1)E(D0)E(Di)


Du meinst, ich , ob für jedes k konstant ist, oder? E(Dk)
Mjnichol

@mjnichol rechts
Neil G

0

Die "erwartete Verteilung" ändert sich nicht. Man könnte ein Martingal-Argument gebrauchen! Ich werde dies später zur Antwort hinzufügen (ich reise jetzt).

Die Verteilung, abhängig von den früheren Ziehungen (für die späteren Ziehungen), ändert sich nur, wenn Sie die Ziehungen tatsächlich beobachten. Wenn Sie den Ball mit einer fest geschlossenen Hand aus der Urne ziehen und ihn dann wegwerfen, ohne seine Farbe zu beobachten (ich habe ein solches Theater effektiv als Klassendemonstration verwendet), ändert sich die Verteilung nicht. Diese Tatsache hat eine Erklärung: Bei Wahrscheinlichkeit geht es um Information, Wahrscheinlichkeit ist ein Informationskonzept.

Wahrscheinlichkeiten ändern sich also nur, wenn Sie neue Informationen erhalten (dh bedingte Wahrscheinlichkeiten). Wenn Sie den Ball ziehen und wegwerfen, ohne ihn zu beobachten, erhalten Sie keine neuen Informationen. Es gibt also nichts Neues, auf das Sie sich einstellen können. Wenn Sie also den tatsächlichen Informationssatz bedingen, hat sich dieser nicht geändert, sodass sich die bedingte Verteilung nicht ändern kann.

 EDIT

Ich werde dieser Antwort jetzt nicht viel mehr Details geben, sondern nur eine Referenz hinzufügen: Hosam M. Mahmoud: "Pólya Urn Models" (Chapman & Hall), die Urnenmodelle wie das in dieser Frage behandelt, und auch viel allgemeinere Urnen Schemata, auch unter Verwendung von Martingal-Methoden, um Grenzwerte zu erhalten. Die Martingal-Methoden werden für die Frage in diesem Beitrag jedoch nicht benötigt.


Die Verteilung (für die späteren Ziehungen) ändert sich auch dann nicht , wenn Sie die Ziehungen tatsächlich beobachten. Warum sollte das Beobachten etwas ändern?
Neil G

1
@Neil Ich denke, kjetil bezieht sich auf die Verteilung , die von den beobachteten Ziehungen abhängig ist .
Silverfish

@ Silverfish: Ah ich verstehe. Du hast recht, ich entschuldige mich.
Neil G

Ich werde bearbeiten, um in zwei Wochen klarer zu machen, wenn ich zu Hause bin. Für jetzt Urlaub in Venezia ...
kjetil b halvorsen
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.