Es besteht die Möglichkeit, dass das Bootstrap-Beispiel genau dem Originalbeispiel entspricht


9

Ich möchte nur einige Argumente überprüfen.

Wenn mein Originalmuster die Größe und ich es boote, ist mein Denkprozess wie folgt:n

1n ist die Wahrscheinlichkeit einer Beobachtung aus der Originalprobe. Um sicherzustellen, dass die nächste Ziehung nicht die zuvor untersuchte Beobachtung ist, beschränken wir die Stichprobengröße auf . So erhalten wir dieses Muster:n- -1

1n1n- -11n- -21n- -(n- -1)=1n!.

Ist das richtig? Ich stolpere darüber, warum es nicht .(1n)n


1
Ich bin mir nicht sicher, ob ich dir folge. Warum möchten Sie "sicherstellen, dass die nächste Ziehung nicht die vorherige Stichprobe ist"? Beim Bootstrapping besteht die Idee darin, ein Beispiel mit Ersatz zu erstellen. Das heißt, Sie tun wollen , dass es möglich sein , dass die nächste Ziehung ist das gleiche wie man Ihnen bereits gezeichnet.
Gung - Reinstate Monica

Aber heißt das nicht, dass das Bootstrap-Beispiel nicht mit dem Originalmuster übereinstimmt?
Jayant.M

Ich folge dir nicht. Sie möchten nicht unbedingt, dass die Boot-Stichprobe mit Ihrer Stichprobe identisch ist, sondern möchten die Stichprobe lediglich als Modell der Grundgesamtheit behandeln.
Gung - Reinstate Monica

1
Meine Frage ist also, wie groß die Wahrscheinlichkeit ist, dass das Bootstrap-Beispiel mit dem Originalbeispiel identisch ist. Ich bin daran interessiert, dass der Bootstrap mit dem Beispiel identisch ist
Jayant.M

Entschuldigung, wenn meine Frage nicht klar war!
Jayant.M

Antworten:


17

Beachten Sie, dass wir an jeder Beobachtungsposition ( ) eine der Beobachtungen auswählen können , so dass es mögliche Resamples gibt (wobei die Reihenfolge beibehalten wird, in der sie gezeichnet werden), von denensind die "gleiche Stichprobe" (dh sie enthalten alle ursprünglichen Beobachtungen ohne Wiederholungen; dies erklärt alle Arten der Bestellung der Stichprobe, mit der wir begonnen haben).n n n n ! nich=1,2,...,nnnnn!n

Mit drei Beobachtungen, a, b und c, haben Sie beispielsweise 27 mögliche Stichproben:

aaa aab aac aba abb abc aca acb acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc 

Sechs davon enthalten jeweils eines von a, b und c.

Also ist die Wahrscheinlichkeit, dass die ursprüngliche Stichprobe zurückerhalten wird.n!/.nn

Nebenbei - eine schnelle Annäherung an die Wahrscheinlichkeit:

Bedenken Sie Folgendes :

2π nn+12e- -nn!e nn+12e- -n

so

2π n12e- -nn!/.nne n12e- -n

Die untere Grenze ist die übliche für die Stirling-Näherung (die für großes einen geringen relativen Fehler aufweist ).n

[Gosper hat vorgeschlagen , was die Näherung ergeben würden!(2n+13)πnne- -n für diese Wahrscheinlichkeit, die bis zu n = 3 oder sogar bis zu n = 1 ziemlich gut funktioniert,je nachdem, wie streng Ihre Kriterien sind.](2n+13)πe- -nn=3n=1


(Antwort auf Kommentar :) Die Wahrscheinlichkeit, in einem bestimmten Resample keine bestimmte Beobachtung zu erhalten, beträgt was für großesnungefähre-1 ist.(1- -1n)nne- -1

Einzelheiten finden Sie unter
Warum enthält jedes Bootstrap-Beispiel im Durchschnitt ungefähr zwei Drittel der Beobachtungen?


ein,b,cein

1
Das wird bereits in anderen Antworten vor Ort behandelt, aber ich habe es oben (kurz) hinzugefügt.
Glen_b -State Monica

1
(1n)n

1
n!

1
n=1n=3n=2n=1
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.