Beachten Sie, dass wir an jeder Beobachtungsposition ( ) eine der Beobachtungen auswählen können , so dass es mögliche Resamples gibt (wobei die Reihenfolge beibehalten wird, in der sie gezeichnet werden), von denensind die "gleiche Stichprobe" (dh sie enthalten alle ursprünglichen Beobachtungen ohne Wiederholungen; dies erklärt alle Arten der Bestellung der Stichprobe, mit der wir begonnen haben).n n n n ! ni = 1 , 2 , . . . , nnnnn !n
Mit drei Beobachtungen, a, b und c, haben Sie beispielsweise 27 mögliche Stichproben:
aaa aab aac aba abb abc aca acb acc
baa bab bac bba bbb bbc bca bcb bcc
caa cab cac cba cbb cbc cca ccb ccc
Sechs davon enthalten jeweils eines von a, b und c.
Also ist die Wahrscheinlichkeit, dass die ursprüngliche Stichprobe zurückerhalten wird.n ! / nn
Nebenbei - eine schnelle Annäherung an die Wahrscheinlichkeit:
Bedenken Sie Folgendes :
2 π- -- -√ nn + 12e- n≤ n ! ≤ e n n + 12e- n
so
2 π- -- -√ n12e- n≤ n ! / nn≤ e n 12e- n
Die untere Grenze ist die übliche für die Stirling-Näherung (die für großes einen geringen relativen Fehler aufweist ).n
[Gosper hat vorgeschlagen , was die Näherung √ ergeben würden ! ≈ ( 2 n + 13)π- -- -- -- -- -- -- -- -- -√nne- n für diese Wahrscheinlichkeit, die bis zu n = 3 oder sogar bis zu n = 1 ziemlich gut funktioniert,je nachdem, wie streng Ihre Kriterien sind.]( 2 n + 13) π- -- -- -- -- -- -- -- -√e- nn = 3n = 1
(Antwort auf Kommentar :) Die Wahrscheinlichkeit, in einem bestimmten Resample keine bestimmte Beobachtung zu erhalten, beträgt was für großesnungefähre-1 ist.( 1 - 1n)nne- 1
Einzelheiten finden Sie unter
Warum enthält jedes Bootstrap-Beispiel im Durchschnitt ungefähr zwei Drittel der Beobachtungen?