Kontext
Eine Gruppe von Sozialwissenschaftlern und Statistikern ( Benjamin et al., 2017 ) hat kürzlich vorgeschlagen, dass die typische falsch-positive Rate ( = 0,05), die als Schwelle für die Bestimmung der "statistischen Signifikanz" verwendet wird, an eine konservativere Schwelle angepasst werden muss ( = .005). Eine konkurrierende Gruppe von Sozialwissenschaftlern und Statistikern ( Lakens et al., 2018 ) hat geantwortet und sich gegen die Verwendung dieser - oder einer anderen - willkürlich gewählten Schwelle ausgesprochen . Das Folgende ist ein Zitat von Lakens et al. (S. 16) das hilft, das Thema meiner Frage zu veranschaulichen:
Im Idealfall wird das Alpha-Niveau durch Vergleichen von Kosten und Nutzen mit einer Nutzenfunktion unter Verwendung der Entscheidungstheorie bestimmt. Diese Kosten-Nutzen-Analyse (und damit das Alpha-Niveau) unterscheidet sich bei der Analyse großer vorhandener Datensätze von der Erfassung von Daten aus schwer zu beschaffenden Proben. Die Wissenschaft ist vielfältig, und es liegt an den Wissenschaftlern, das von ihnen gewählte Alpha-Niveau zu begründen. ... Die Forschung sollte sich an strengen wissenschaftlichen Grundsätzen orientieren, nicht an Heuristiken und willkürlichen pauschalen Schwellenwerten.
Frage
Ich frage mich, wie man ein ausgewähltes Alpha so rechtfertigen kann, dass es sich "an Grundsätzen strenger Wissenschaft orientiert", wie Lakens et al. In den meisten sozialwissenschaftlichen Kontexten (dh außerhalb ausgewählter Fälle, in denen man eine konkretere Qualität wie Profit hat, um zu optimieren) vorschlagen?
Nach der Verbreitung von Lakens et al. Habe ich angefangen, Online-Taschenrechner im Umlauf zu sehen, um Forschern bei dieser Entscheidung zu helfen. Bei ihrer Verwendung müssen Forscher ein "Kostenverhältnis" von falsch-positiven und falsch-negativen Fehlern angeben. Wie dieser Taschenrechner hier vorschlägt, kann das Bestimmen eines solchen Kostenverhältnisses jedoch eine Menge quantitativer Vermutungen erfordern:
Während einige Fehlerkosten monetär leicht zu beziffern sind (direkte Kosten), ist es für andere schwierig, einen Dolar-Betrag anzugeben (indirekte Kosten). ... Trotz der schwierigen Quantifizierung sollten Sie sich bemühen, ihnen eine Zahl zuzuweisen.
Zum Beispiel, obwohl Lakens et al. Schlagen Sie vor, schwer erreichbare Stichproben als einen Faktor zu untersuchen, den man für die Rechtfertigung von Alpha in Betracht ziehen könnte. Es scheint, als würde man immer noch raten, wie schwer diese Stichprobe zu erreichen ist und wie man die Auswahl von Alpha entsprechend anpasst. Als weiteres Beispiel erscheint es mir schwierig, die Kosten für die Veröffentlichung eines Falsch-Positivs zu beziffern, wenn man bedenkt, wie viel Zeit / Geld andere später für die Verfolgung von Untersuchungen auf der Grundlage der falschen Schlussfolgerung aufwenden würden.
Wenn die Ermittlung dieser Kostenquote größtenteils auf subjektiven Best-Guess-Making beruht, frage ich mich, ob diese Entscheidungen jemals (auch außerhalb der Optimierung von Gewinnen) "gerechtfertigt" werden können. Das heißt, auf eine Weise, die außerhalb der getroffenen Annahmen über Stichproben, Kompromisse, Auswirkungen usw. Besteht. Auf diese Weise erscheint mir die Bestimmung eines Kostenverhältnisses von falsch-positiven / falsch-negativen Fehlern so ähnlich wie die Auswahl eines Priores in der Bayes'schen Folgerung - eine Entscheidung, die etwas subjektiv sein kann, die Ergebnisse beeinflusst und daher diskutiert wird. -Obwohl ich nicht sicher bin, ob das ein vernünftiger Vergleich ist.
Zusammenfassung
Um meine Anfrage konkret zu machen:
- Können falsch-positive / falsch-negative Quoten und ihre Kostenverhältnisse in den meisten sozialwissenschaftlichen Zusammenhängen jemals "rigoros" gerechtfertigt werden?
- Wenn ja, nach welchen verallgemeinerbaren Grundsätzen könnte man diese analytischen Entscheidungen rechtfertigen (und vielleicht ein oder zwei Beispiele in Aktion)?
- Wenn nicht, ist meine Analogie zur möglichen Subjektivität bei der Auswahl der Kostenquoten - ähnlich wie bei der Bayes'schen Vorauswahl - vernünftig?
Verweise
Benjamin, DJ, Berger, J., Johannesson, M., Nosek, BA, Wagenmakers, E., ... Johnson, V. (2017, 22. Juli). Definieren Sie die statistische Signifikanz neu. Abgerufen von psyarxiv.com/mky9j
Lakens, D., Adolfi, FG, Albers, CJ, Anvari, F., Apps, MA, ... Zwaan, RA (2018, 15. Januar). Begründen Sie Ihr Alpha. Abgerufen von psyarxiv.com/9s3y6