Wann / warum unterscheidet sich die zentrale Tendenz einer Resampling-Simulation deutlich vom beobachteten Wert?


8

Sollte man immer erwarten, dass die zentrale Tendenz (dh der Mittelwert und / oder der Median) einer Bootstrap-Probe dem beobachteten Wert ähnlich ist?

In diesem speziellen Fall habe ich Antworten, die für Probanden unter zwei Bedingungen exponentiell verteilt sind (ich habe das Experiment nicht durchgeführt, ich habe nur die Daten). Ich wurde beauftragt, die Effektgröße zu booten (in Bezug auf Cohens d, die Ein-Stichproben-Formel, dh wobei die Stichprobenschätzung der Populationsstandardabweichung ist. Das Forum dafür ist bereitgestellt in Rosenthal & Rosnow (2008) auf S. 398, Gleichung 13.27. Sie verwenden im Nenner, weil es historisch korrekt ist, jedoch hat die Standardpraxis d als Verwendung von falsch definiert , und so folge ich diesem Fehler in der obigen Berechnung .M.D.¯sD.σs

Ich habe sowohl innerhalb der Teilnehmer (dh die RT eines Teilnehmers kann mehr als einmal beprobt werden) als auch zwischen den Probanden (Teilnehmer können mehr als einmal beprobt werden) so randomisiert, dass selbst wenn Teilnehmer 1 zweimal beprobt wird, ihre mittlere RT in beiden Stichproben unwahrscheinlich ist genau gleich. Für jeden randomisierten / neu abgetasteten Datensatz berechne ich d neu. In diesem Fall ist . Was ich beobachte, ist ein Trend, dass der beobachtete Wert von Cohens d typischerweise näher am 97,5-Perzentil von als am 2,5-Perzentil der simulierten beobachteten Werte liegt. Es liegt auch tendenziell näher bei 0 als der Median des Bootstraps (um 5% bis 10% der Dichte der simulierten Verteilung).N.sichm=10000

Was kann das erklären (unter Berücksichtigung des Ausmaßes des Effekts, den ich beobachte)? Liegt es daran, dass es beim erneuten Abtasten „einfacher“ ist, extremere Varianzen zu erhalten als bei der erneuten Abtastung in Bezug auf die äußersten Mittelwerte? Könnte dies ein Spiegelbild von Daten sein, die übermäßig massiert / selektiv getrimmt wurden? Entspricht dieser Resampling-Ansatz einem Bootstrap? Wenn nicht, was muss noch getan werden, um ein CI zu erstellen?

Antworten:


4

Jede nichtlineare Statistik (eine nichtlineare Kombination linearer Statistiken wie Stichprobenmittel) weist eine geringe Stichprobenverschiebung auf. Cohens ist offensichtlich keine Ausnahme: Es ist im Wesentlichen d = m 1 - m 2d was ziemlich nichtlinear ist, zumindest was die Terme im Nenner angeht. Jeder der Momente kann als unvoreingenommener Schätzer dessen angesehen werden, was geschätzt werden soll: m1=1

d=m1- -m2m3- -m42
Durch Jensens Ungleichung gibt es jedoch keine Möglichkeit auf der Erde, einen unvoreingenommenen Schätzer der Populationsmenge aus einer nichtlinearen Kombination zu erhalten. Somit istE[d]Populationdin endlichen Stichproben, obwohl die Vorspannung typischerweise in der Größenordnung vonO(1/n) liegt. Der Wikipedia-Artikel über Effektgrößenerwähnt die kleinen Stichprobenverzerrungen bei der Diskussion von Hedges 'g.
m1=1n1ichGruppe 1yich,m2=1n2ichGruppe 2yich,m3=1n1+n2ichyich2,m4=1n1+n2ichyich,
E.[d]]dÖ(1/.n)G

dd±21/.n

Was Bootstrap auf wundersame Weise tut, wenn man bedenkt, dass es sich um eine so einfache Methode handelt, ist, dass Sie diese endliche Stichprobenverschiebung durch Vergleich des Bootstrap-Mittelwerts und der Schätzung aus der ursprünglichen Stichprobe abschätzen können. (Beachten Sie jedoch, dass erstere , sofern Sie keine besonderen Anpassungen an der Einrichtung der Bootstrap-Stichprobe vornehmen , der Variabilität von Monte Carlo unterliegen.) Ich habe in einer anderen Bootstrap-Frage detailliertere und technischere Erklärungen gegeben, die ohnehin lesenswert sein könnten.

dθ^nθ¯nb^n=θ¯n- -θ^nθ^n- -b^n=2θ^n- -θ¯n


1
Mir war bereits bewusst, dass Cohens d eine voreingenommene Statistik war. Ich schätze die Details bezüglich der Gründe, warum es voreingenommen ist. Trotzdem bin ich ein wenig skeptisch, dass es in dem Maße voreingenommen ist, wie ich es beobachte. Der Wikipedia-Artikel definiert kein 'a' in der referenzierten Gleichung. Darüber hinaus scheinen die referenzierte und Ihre Gleichung auf die beiden Beispielversionen von Cohens d zu verweisen. Ich bin mir also nicht sicher, welches Ausmaß an Voreingenommenheit ich in diesem Fall erwarten sollte und ob Ihre Antwort den Unterschied abdeckt, den ich sehe.
Russellpierce

Ich bin mir auch nicht sicher, wie ich Ihre letzten beiden Absätze kombinieren soll. Mit Bootstrap können Sie die Verzerrung abschätzen, aber es werden auch Ergebnisse erzielt, die voreingenommener sind als die ursprüngliche Stichprobe.
Russellpierce

eineind

einÖ(1/.n)

Ö(1/.n)1/.n1- -108/.neinichxJ.(ein)ist eine Abkürzung für das Verhältnis der Gammafunktionen.
StasK
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.