Fazit : Je mehr ich über Statistik lerne, desto weniger vertraue ich veröffentlichten Artikeln in meinem Bereich. Ich glaube einfach, dass Forscher ihre Statistiken nicht gut genug machen.
Ich bin sozusagen ein Laie. Ich bin in Biologie ausgebildet, aber ich habe keine formale Ausbildung in Statistik oder Mathematik. Ich mag R und bemühe mich oft, einige der theoretischen Grundlagen der Methoden zu lesen (und zu verstehen ...), die ich bei der Forschung anwende. Es würde mich nicht überraschen, wenn die Mehrheit der Menschen, die heute Analysen durchführen, nicht offiziell geschult ist. Ich habe ungefähr 20 Originalarbeiten veröffentlicht, von denen einige von anerkannten Fachzeitschriften akzeptiert wurden, und Statistiker waren häufig an dem Überprüfungsprozess beteiligt. Meine Analysen umfassen üblicherweise Überlebensanalysen, lineare Regression, logistische Regression und gemischte Modelle. Noch nie hat ein Prüfer nach Modellannahmen, -anpassungen oder -bewertungen gefragt.
Daher habe ich mich nie zu sehr mit Modellannahmen, -anpassung und -bewertung befasst. Ich beginne mit einer Hypothese, führe die Regression durch und präsentiere dann die Ergebnisse. In einigen Fällen habe ich mich bemüht, diese Dinge zu bewerten, aber ich habe immer " gut, es hat nicht alle Annahmen erfüllt, aber ich vertraue den Ergebnissen (" Fachwissen ") und sie sind plausibel, also ist es in Ordnung " und " gut " Wenn sie einen Statistiker konsultierten, schienen sie immer einer Meinung zu sein.
Jetzt habe ich mit anderen Statistikern und Nicht-Statistikern (Chemikern, Ärzten und Biologen) gesprochen, die selbst Analysen durchführen. Es scheint, dass sich die Leute nicht allzu sehr um all diese Annahmen und formalen Bewertungen kümmern. Aber hier im CV gibt es eine Fülle von Leuten, die nach Residuen, Modellanpassung, Auswertungsmöglichkeiten, Eigenwerten, Vektoren und der Liste fragen. Lassen Sie es mich so sagen, wenn lme4 vor großen Eigenwerten warnt, bezweifle ich wirklich, dass viele seiner Benutzer sich darum bemühen, dies zu beheben ...
Lohnt sich der zusätzliche Aufwand? Ist es nicht wahrscheinlich, dass die Mehrheit aller veröffentlichten Ergebnisse diese Annahmen nicht respektiert und sie möglicherweise nicht einmal bewertet hat? Dies ist wahrscheinlich ein wachsendes Problem, da die Datenbanken von Tag zu Tag größer werden und die Annahme und Bewertung umso weniger wichtig ist, je größer die Daten sind.
Ich könnte absolut falsch liegen, aber so habe ich das wahrgenommen.
Update: Zitat von StasK (unten): http://www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15509