Im Februar 2016 veröffentlichte die American Statistical Association eine formelle Erklärung zur statistischen Signifikanz und zu den p-Werten. In unserem Thread werden diese Themen ausführlich behandelt. Es hat sich jedoch bisher keine Autorität herauskristallisiert, um eine allgemein anerkannte wirksame Alternative anzubieten. Die American Statistical Society (ASS) hat ihre Antwort veröffentlicht, p-Werte: Was kommt als nächstes?
"Der p-Wert ist nicht gut für viel."
Wir glauben, dass die ASA nicht weit genug gegangen ist. Es ist Zeit zuzugeben, dass die Ära der p-Werte vorbei ist. Statistiker haben sie erfolgreich eingesetzt, um Studenten, Trickwissenschaftler und Narrenredakteure überall zu verblüffen, aber die Welt beginnt, diese List zu durchschauen. Wir müssen den Versuch der Statistiker, die Entscheidungsfindung zu kontrollieren, zu Beginn des 20. Jahrhunderts aufgeben. Wir müssen zu dem zurückkehren, was tatsächlich funktioniert.
Der offizielle ASS-Vorschlag lautet:
Anstelle von p-Werten befürwortet der ASS das STOP (SeaT-Of-Pants-Verfahren). Diese altehrwürdige und erprobte Methode wurde von den alten Griechen, Renaissance-Männern und allen Wissenschaftlern angewendet, bis Ronald Fisher kam und Dinge ruinierte. Der STOP ist einfach, direkt, datengesteuert und maßgeblich. Zu diesem Zweck überprüft eine Autoritätsperson (vorzugsweise ein älterer Mann) die Daten und entscheidet, ob sie mit seiner Meinung übereinstimmt. Wenn er entscheidet, dass dies der Fall ist, ist das Ergebnis "signifikant". Andernfalls ist dies nicht der Fall und jeder muss das Ganze vergessen.
Prinzipien
Die Antwort geht auf jedes der sechs Prinzipien der ASA ein.
Der STOP kann anzeigen, wie inkompatibel die Daten mit einem bestimmten statistischen Modell sind.
Wir mögen diesen Satz, weil es eine so ausgefallene Art ist zu sagen, dass STOP jede Frage mit Ja oder Nein beantwortet. Anders als bei p-Werten oder anderen statistischen Verfahren besteht kein Zweifel. Dies ist die perfekte Antwort für diejenigen, die sagen: „Wir brauchen keine Nullhypothese! Was zum *?! @ Ist das überhaupt? Niemand konnte jemals herausfinden, was es sein sollte. “
Der STOP misst nicht die Wahrscheinlichkeit, dass eine Hypothese wahr ist: Er entscheidet tatsächlich, ob sie wahr ist oder nicht.
Wahrscheinlichkeiten verwirren jeden. Indem die Wahrscheinlichkeit aus dem Bild gestrichen wird, macht der STOP jahrelanges Studium überflüssig. Jetzt kann jeder (der alt und männlich genug ist) statistische Analysen durchführen, ohne den Schmerz und die Qual eines einzigen statistischen Vortrags oder der Ausführung einer geheimen Software, die unverständliche Ergebnisse liefert.
Wissenschaftliche Schlussfolgerungen und geschäftliche oder politische Entscheidungen können auf dem gesunden Menschenverstand und tatsächlichen Autoritätspersonen beruhen.
Wichtige Entscheidungen wurden sowieso immer von den Behörden getroffen. Lassen Sie es uns einfach zugeben und die Zwischenhändler ausschalten. Mit der STOP-Taste können Statistiker das tun, wofür sie am besten geeignet sind: Zahlen verwenden, um die Wahrheit zu verschleiern und die Vorlieben der Machthaber zu bereinigen.
Der richtige Rückschluss erfordert eine vollständige Berichterstattung und Transparenz.
Der STOP ist das transparenteste und offensichtlichste statistische Verfahren, das jemals erfunden wurde: Sie sehen sich die Daten an und entscheiden. Es eliminiert all diese verwirrenden Z-Tests, T-Tests, Chi-Quadrat-Tests und Alphabet-Suppen-Verfahren (ANOVA! GLM! MLE!), Die von Menschen verwendet werden, um die Tatsache zu verbergen, dass sie keine Ahnung haben, was die Daten bedeuten.
Der STOP misst die Wichtigkeit des Ergebnisses.
Dies ist selbstverständlich: Wenn eine Person in der Behörde den STOP-Befehl verwendet, muss das Ergebnis wichtig sein.
An sich liefert der STOP eine gute Evidenz für ein Modell oder eine Hypothese.
Wir möchten doch keine Autorität anfechten, oder? Forscher und Entscheidungsträger werden erkennen, dass der STOP alle Informationen liefert, die sie wissen müssen. Aus diesen Gründen kann die Datenanalyse mit dem STOP enden; Alternative Ansätze wie p-Werte, maschinelles Lernen oder Astrologie sind nicht erforderlich.
Andere Ansätze
Einige Statistiker bevorzugen sogenannte "Bayesian" -Methoden, bei denen ein obskurer Satz, der posthum von einem Geistlichen aus dem 18. Jahrhundert veröffentlicht wurde, sinnlos angewendet wird, um jedes Problem zu lösen. Die bekanntesten Befürworter geben frei zu, dass diese Methoden „subjektiv“ sind. Wenn wir subjektive Methoden anwenden, ist das Ergebnis natürlich umso besser, je zuverlässiger und sachkundiger der Entscheidungsträger ist. Der STOPP stellt sich dabei als logische Grenze aller Bayes-Methoden heraus. Warum sollte man sich die Mühe machen, diese schrecklichen Berechnungen durchzuführen und so viel Computerzeit zu verbrauchen, wenn man dem Verantwortlichen die Daten nur zeigen und ihn nach seiner Meinung fragen kann? Ende der Geschichte.
Kürzlich ist eine andere Gemeinschaft entstanden, um das Priestertum der Statistiker herauszufordern. Sie bezeichnen sich selbst als "Maschinenlerner" und "Datenwissenschaftler", aber sie sind wirklich nur Hacker, die nach einem höheren Status suchen. Es ist die offizielle Position des ASS, dass diese Jungs ihre eigene professionelle Organisation gründen sollten, wenn sie wollen, dass die Leute sie ernst nehmen.
Die Frage
Ist dies die Antwort auf die Probleme, die die ASA beim Testen von p-Werten und Nullhypothesen festgestellt hat? Kann es das Bayesianische und das Frequentistische Paradigma (wie implizit in der Antwort behauptet) wirklich vereinen?