Bootstrapping mit einer kleinen Anzahl von Beobachtungen


8

Angenommen, ich habe eine kleine Anzahl (N) von Beobachtungen für eine Hypothese gesammelt , die ich testen möchte. Ich könnte die Bootstrap-Methode verwenden, um eine Stichprobenverteilung für das mittlere Ergebnis von N Beobachtungen zu erstellen, aber ich befürchte, dass dieses Modell zusammenbrechen könnte, wenn N sehr klein wird, was zu Fehlern in der Stichprobenverteilung selbst führt.

Meine Frage ist also, wie ich bestimmen kann, welches Minimum N ich für vernünftige Ergebnisse benötige. oder quantitativer, wie ist N an den Abtastfehler als N-> 0 gebunden?

Update: Ich werde verstehen, dass der Mindestwert für N abhängig von der Art der zugrunde liegenden Daten variiert. Welche Meta-Beobachtungen kann ich in diesem Fall machen, um dies festzustellen? Ich kenne die wahre zugrunde liegende Distribution nicht, sonst müsste ich nicht booten.


1
Ich habe einen interessanten Kommentar in den Vorlesungsunterlagen von Prof. Wasserman unter stat.cmu.edu/~larry/=stat705/Lecture13.pdf gesehen . Die Notation neben Gleichung (21) auf p. 6 legt nahe, dass der Fehler, mit dem Sie sich befassen, als 1 / sqrt (n) abfällt. Leider weiß ich nichts über den konstanten Koeffizienten.
Max

Antworten:


7

Es gibt keine eindeutige Antwort darauf, da dies immer von der tatsächlichen Verteilung Ihrer Daten abhängt (stellen Sie sich den entarteten Fall vor, in dem nur 1 zulässig ist: Dann ist ein Bootstrap aus einer Stichprobe der Größe 1 so gut wie alles andere !) und die Statistik, die Sie berechnen werden: Einige Statistiken haben mehr Probleme, sich von einer kleinen Stichprobengröße zu erholen als andere (stellen Sie sich ein Resampling eines extremen Ausreißers vor).

Also: Sie müssen genauer sein als das, was Sie uns bisher gegeben haben.


1
Kann man anhand der Beobachtungen Rückschlüsse auf die wahre Verteilung ziehen, vielleicht unter Verwendung der Varianz der Beobachtungen? Der extreme Ausreißerfall ist schwierig, aber wenn Sie einen gesehen haben, enthält dieser eine Menge Informationen. Wenn wir die Frage überarbeiten, um N> 2 anzugeben, sagt uns bereits die zweite Beobachtung etwas, wenn N1 = N2 vs N1! = N2 (und was der Unterschied zwischen ihnen ist).
G__

Bootstrapping von Extremen funktioniert nicht, Punkt.
kjetil b halvorsen
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.