Morey et al. (2015) argumentieren, dass Konfidenzintervalle irreführend sind und es mehrere Vorurteile gibt, die mit ihrem Verständnis zusammenhängen. Unter anderem beschreiben sie den Präzisionsfehler wie folgt:
Der Genauigkeitsfehler
Die Breite eines Konfidenzintervalls zeigt die Genauigkeit unseres Wissens über den Parameter an. Enge Konfidenzintervalle zeigen genaues Wissen, während breite Konfidenzfehler ungenaues Wissen anzeigen.Es besteht kein notwendiger Zusammenhang zwischen der Genauigkeit einer Schätzung und der Größe eines Konfidenzintervalls. Eine Möglichkeit, dies zu sehen, besteht darin, sich vorzustellen, dass zwei Forscher - ein leitender Forscher und ein Doktorand - Daten von Teilnehmern eines Experiments analysieren . Als Übung zum Wohle des Doktoranden beschließt der Senior Researcher, die Teilnehmer nach dem Zufallsprinzip in zwei Sätze zu je damit sie jeweils die Hälfte des Datensatzes separat analysieren können. In einer anschließenden Besprechung teilen die beiden untereinander die Vertrauensintervalle ihrer Schüler für den Mittelwert. Der CI des Doktoranden beträgt CI und der CI des Senior-Forschers beträgt CI .25 t 95 % 52 ± 2 95 % 53 ± 4
Der leitende Forscher stellt fest, dass ihre Ergebnisse weitgehend konsistent sind und dass sie den gleichgewichteten Mittelwert ihrer beiden jeweiligen Punktschätzungen ( ) als Gesamtschätzung des wahren Mittelwerts verwenden könnten .
Die Doktorandin argumentiert jedoch, dass ihre beiden Mittel nicht gleichmäßig gewichtet werden sollten: Sie stellt fest, dass ihr CI halb so breit ist und argumentiert, dass ihre Schätzung genauer ist und daher stärker gewichtet werden sollte. Ihr Berater stellt fest, dass dies nicht korrekt sein kann, da die Schätzung der ungleichmäßigen Gewichtung der beiden Mittelwerte von der Schätzung der Analyse des gesamten Datensatzes abweicht, der muss . Der Fehler des Doktoranden besteht darin, dass CIs direkt die Genauigkeit nach der Datenerfassung anzeigen.
Das obige Beispiel scheint irreführend zu sein. Wenn wir eine Stichprobe zufällig in zwei Stichproben aufteilen, erwarten wir, dass sowohl die Stichprobenmittelwerte als auch die Standardfehler nahe beieinander liegen. In diesem Fall sollte es keinen Unterschied zwischen der Verwendung eines gewichteten Mittels (z. B. gewichtet durch inverse Fehler) und der Verwendung eines einfachen arithmetischen Mittels geben. Wenn sich die Schätzungen jedoch unterscheiden und die Fehler in einer der Stichproben merklich größer sind, könnte dies auf "Probleme" mit einer solchen Stichprobe hindeuten.
Offensichtlich sind im obigen Beispiel die Stichprobengrößen gleich, so dass das "Zusammenführen" der Daten durch Mittelwertbildung mit dem Mittelwertbildung für die gesamte Stichprobe identisch ist. Das Problem ist, dass das gesamte Beispiel der unklaren Logik folgt, dass die Stichprobe zunächst in Teile geteilt und dann für die endgültige Schätzung wieder zusammengefügt wird.
Das Beispiel kann umformuliert werden, um genau die gegenteilige Schlussfolgerung zu ziehen:
Der Forscher und der Student beschlossen, ihren Datensatz in zwei Hälften aufzuteilen und sie unabhängig voneinander zu analysieren. Danach verglichen sie ihre Schätzungen und es stellte sich heraus, dass die Stichprobe bedeutete, dass sie sehr unterschiedlich berechnet wurden, außerdem war der Standardfehler der Schätzung des Schülers viel größer. Der Student befürchtete, dass dies auf Probleme mit der Genauigkeit seiner Schätzung hindeuten könnte, aber der Forscher implizierte, dass es keinen Zusammenhang zwischen Konfidenzintervallen und Genauigkeit gibt, sodass beide Schätzungen gleichermaßen vertrauenswürdig sind und sie jede zufällig ausgewählte von ihnen veröffentlichen können. als ihre endgültige Schätzung.
Formal ausgedrückt basieren "Standard" -Konfidenzintervalle wie das des Schülers auf Fehlern
Wobei eine Konstante ist. In einem solchen Fall stehen sie in direktem Zusammenhang mit der Präzision, nicht wahr?
Meine Frage lautet also:
Ist der Präzisions-Irrtum wirklich ein Irrtum? Was sagen Konfidenzintervalle über Präzision aus?
Morey, R., Hoekstra, R., Rouder, J., Lee, M. & Wagenmakers, E.-J. (2015). Der Trugschluss, Vertrauen in Vertrauensintervalle zu setzen. Psychonomic Bulletin & Review, 1-21. https://learnbayes.org/papers/confidenceIntervalsFallacy/