Ich lese Gelman & Carlin "Jenseits von Leistungsberechnungen: Bewertung von Fehlern vom Typ S (Vorzeichen) und Typ M (Größe)" (2014). Ich versuche, die Hauptidee, die Hauptidee, zu verstehen, aber ich bin verwirrt. Könnte mir jemand helfen, die Essenz zu destillieren?
Das Papier geht ungefähr so (wenn ich es richtig verstanden habe).
- Statistische Studien in der Psychologie werden oft von kleinen Stichproben geplagt.
- Abhängig von einem statistisch signifikanten Ergebnis in einer bestimmten Studie wird
(1) die wahre Effektgröße wahrscheinlich stark überschätzt und
(2) das Vorzeichen des Effekts kann mit hoher Wahrscheinlichkeit entgegengesetzt sein - es sei denn, die Stichprobengröße ist groß genug. - Das Obige wird unter Verwendung einer vorherigen Schätzung der Effektgröße in der Population gezeigt, und dieser Effekt wird typischerweise als gering angesehen.
Mein erstes Problem ist, warum Bedingung für das statistisch signifikante Ergebnis? Soll es die Publikationsbias widerspiegeln? Dies scheint jedoch nicht der Fall zu sein. Warum also?
Mein zweites Problem ist, wenn ich selbst eine Studie mache, sollte ich meine Ergebnisse anders behandeln als ich es gewohnt bin (ich mache frequentistische Statistiken, die mit Bayesian nicht sehr vertraut sind)? Zum Beispiel würde ich eine Datenprobe nehmen, ein Modell schätzen und eine Punktschätzung für einen interessierenden Effekt und ein damit verbundenes Vertrauen aufzeichnen. Soll ich jetzt meinem Ergebnis misstrauen? Oder sollte ich ihm misstrauen, wenn es statistisch signifikant ist? Wie ändert eine bestimmte vorherige Änderung das?
Was ist der wichtigste Aspekt (1) für einen "Produzenten" statistischer Forschung und (2) für einen Leser angewandter statistischer Arbeiten?
Verweise:
- Gelman, Andrew und John Carlin. "Jenseits von Leistungsberechnungen: Bewertung von Fehlern vom Typ S (Vorzeichen) und Typ M (Größe)." Perspectives on Psychological Science 9.6 (2014): 641-651.
PS Ich denke, das neue Element für mich ist die Aufnahme von Vorinformationen, deren Behandlung ich nicht sicher bin (aus dem frequentistischen Paradigma).