Wenn es Jahre gedauert hat, eine Zeitung zu schreiben und eine strenge Peer-Review durchlaufen hat, dann werden die Statistiken doch wirklich solide sein?
Meine Erfahrung mit dem Lesen von Artikeln, die versuchen, Statistiken in einer Vielzahl von Bereichen anzuwenden (Politikwissenschaft, Wirtschaft, Psychologie, Medizin, Biologie, Finanzen, Versicherungsmathematik, Rechnungswesen, Optik, Astronomie und viele, viele andere), ist die Qualität von Die statistische Analyse kann irgendwo im Spektrum liegen, von exzellent und gut gemacht bis zu ungeheurem Unsinn. Ich habe in jedem der genannten Bereiche eine gute Analyse gesehen und in fast allen Bereichen eine ziemlich schlechte Analyse.
Einige Zeitschriften sind im Allgemeinen ziemlich gut, und andere ähneln eher dem Dartspiel mit verbundenen Augen. Die meisten davon sind möglicherweise nicht allzu weit vom Ziel entfernt, aber es gibt einige in der Wand, im Boden und an der Decke. Und vielleicht die Katze.
Ich habe nicht vor, Schuldige zu benennen, aber ich werde sagen, ich habe akademische Karrieren gesehen, die auf der fehlerhaften Verwendung von Statistiken aufbauen (dh in denen dieselben Fehler und Missverständnisse über mehr als ein Jahrzehnt hinweg Papier für Papier wiederholt wurden).
Mein Rat ist also , den Leser aufpassen zu lassen ; Vertrauen Sie nicht, dass die Redakteure und Gutachter wissen, was sie tun. Im Laufe der Zeit können Sie sich ein Bild davon machen, welche Autoren im Allgemeinen nicht allzu schockierend sind und welche besonders vorsichtig behandelt werden sollten. Möglicherweise haben Sie das Gefühl, dass einige Zeitschriften normalerweise einen sehr hohen Standard für ihre Statistiken haben.
Aber selbst ein normalerweise guter Autor kann einen Fehler machen, oder Schiedsrichter und Redakteure können Fehler, die sie normalerweise finden, nicht finden. Ein typisches gutes Tagebuch kann einen Heuler veröffentlichen.
[Manchmal werden Sie sogar sehen, dass wirklich schlechte Zeitungen Preise oder Auszeichnungen gewinnen ... was auch nicht viel für die Qualität der Leute aussagt, die den Preis beurteilen.]
Ich möchte nicht erraten, was für einen Bruchteil von "schlechten" Statistiken ich gesehen haben könnte (in verschiedenen Formen und in jeder Phase von der Definition der Frage, dem Design der Studie, der Datenerfassung, dem Datenmanagement ... bis hin zu ...) Analyse und Schlussfolgerungen), aber es ist bei weitem nicht klein genug, um mich wohl zu fühlen.
Ich könnte Beispiele nennen, aber ich denke nicht, dass dies das richtige Forum dafür ist. (Es wäre schön, wenn es ist ein gutes Forum für das, eigentlich, aber dann wieder, ist es wahrscheinlich sehr würde „politisiert“ ziemlich schnell, und bald nicht ihren Zweck dienen.)
Ich habe einige Zeit damit verbracht, mich in PLOS ONE umzuschauen ... und werde wieder nicht auf bestimmte Papiere verweisen. Einige Dinge, die mir aufgefallen sind: Es sieht so aus, als ob ein großer Teil der Papiere Statistiken enthält, wahrscheinlich mehr als die Hälfte mit Hypothesentests. Die Hauptgefahren scheinen viele Tests zu sein, entweder mit einem hohen Wert von jeweils 0,05 (was nicht automatisch ein Problem ist, solange wir verstehen, dass einige wirklich winzige Effekte zufällig als signifikant auftauchen können) oder ein unglaublicher Wert Niedriges individuelles Signifikanzniveau, das tendenziell zu geringer Leistung führt. Ich habe auch einige Fälle gesehen, in denen etwa ein halbes Dutzend verschiedene Tests durchgeführt wurdenαwurden anscheinend angewendet, um genau die gleiche Frage zu lösen. Das scheint mir eine allgemein schlechte Idee zu sein. Insgesamt war der Standard über ein paar Dutzend Papiere ziemlich gut, aber in der Vergangenheit habe ich dort ein absolut schreckliches Papier gesehen.
[Vielleicht könnte ich mich indirekt nur einem Beispiel hingeben. Bei dieser Frage geht es darum, dass jemand etwas ziemlich zweifelhaftes tut. Es ist alles andere als das Schlimmste, was ich je gesehen habe.]
Andererseits sehe ich auch (noch häufiger) Fälle, in denen Menschen gezwungen sind, durch alle Arten von unnötigen Reifen zu springen, um ihre Analyse zu akzeptieren. Völlig vernünftige Dinge werden nicht akzeptiert, weil es einen "richtigen" Weg gibt, Dinge gemäß einem Rezensenten oder einem Herausgeber oder einem Vorgesetzten oder nur in der unausgesprochenen Kultur eines bestimmten Bereichs zu tun.