Ich höre oft die Behauptung, dass die Bayes'schen Statistiken sehr subjektiv sein können.
Ich auch. Beachten Sie jedoch, dass es eine große Mehrdeutigkeit gibt, etwas Subjektives zu nennen.
Subjektivität (beide Sinne)
Subjektiv kann bedeuten (mindestens) eines von
- hängt von den Eigenheiten des Forschers ab
- explizit mit dem Kenntnisstand einer Person befasst
Der Bayesianismus ist im zweiten Sinne subjektiv, weil er immer eine Möglichkeit bietet, die durch Wahrscheinlichkeitsverteilungen repräsentierten Überzeugungen durch Konditionierung auf Informationen zu aktualisieren. (Beachten Sie, dass es für die Entscheidung, ob es sich bei diesen Annahmen um Annahmen handelt, die ein Subjekt tatsächlich hat oder nur um Annahmen, die ein Subjekt haben könnte , unerheblich ist.)
Das Hauptargument ist, dass die Schlussfolgerung von der Wahl eines Priores abhängt
Eigentlich, wenn ein vor Ihrer persönlichen Glauben an etwas repräsentiert dann fast Sie sicher nicht wählen , es bei mehr als Sie die meisten Ihrer Überzeugungen gewählt haben. Und wenn es die Überzeugungen eines Menschen repräsentiert, kann es eine mehr oder weniger genaue Darstellung dieser Überzeugungen sein. Ironischerweise gibt es eine eher objektive Tatsache darüber, wie gut es ihn repräsentiert.
(obwohl man das Prinzip der Gleichgültigkeit oder der maximalen Entropie verwenden könnte, um einen Prior zu wählen).
Man könnte, obwohl dies nicht dazu neigt, sehr reibungslos auf kontinuierliche Domänen zu verallgemeinern. Außerdem ist es wohl unmöglich, in allen Parametrisierungen gleichzeitig flach oder "gleichgültig" zu sein (obwohl ich mir nie ganz sicher war, warum Sie das wollen).
Im Vergleich dazu, so die Behauptung, ist die frequentistische Statistik im Allgemeinen objektiver. Wie viel Wahrheit steckt in dieser Aussage?
Wie können wir diese Behauptung bewerten?
Ich schlage vor, dass im zweiten Sinne subjektiv: es ist meistens richtig. Und im ersten Sinne subjektiv: Es ist wahrscheinlich falsch.
Frequenz als subjektiv (zweiter Sinn)
Einige historische Details sind hilfreich, um die Probleme abzubilden
Für Neyman und Pearson gibt es nur induktives Verhalten, keine induktive Inferenz, und alle statistischen Auswertungen funktionieren mit Langzeitstichproben von Schätzern. (Daher Alpha und Potenzanalyse, aber keine p-Werte). Das ist in beiden Sinnen ziemlich unsubjektiv.
In der Tat ist es möglich, und ich halte es für vernünftig, in diesem Sinne zu argumentieren, dass Frequentismus eigentlich überhaupt kein Inferenzrahmen ist, sondern eine Sammlung von Bewertungskriterien für alle möglichen Inferenzverfahren, die ihr Verhalten bei wiederholter Anwendung hervorheben. Einfache Beispiele wären Konsistenz, Unparteilichkeit usw. Dies macht es in Sinn 2 offensichtlich unsubjektiv. Es besteht jedoch auch die Gefahr, dass wir in Sinn 1 subjektiv sind, wenn wir entscheiden müssen, was zu tun ist, wenn diese Kriterien nicht zutreffen (z. B. wenn dies nicht der Fall ist ein unvoreingenommener Schätzer zu haben) oder wenn sie zutreffen, aber widersprechen.
Fisher bot einen weniger unsubjektiven Frequentismus an, der interessant ist. Für Fisher gibt es eine induktive Folgerung in dem Sinne, dass ein Subjekt, der Wissenschaftler, auf der Grundlage einer vom Statistiker durchgeführten Datenanalyse Schlussfolgerungen zieht. (Daher p-Werte, aber keine Alpha- und Potenzanalyse). Die Entscheidung darüber, wie man sich verhält, ob man weiter forscht usw., wird jedoch von der Wissenschaftlerin auf der Grundlage ihres Verständnisses der Domänentheorie getroffen, nicht von der Statistikerin, die das Inferenzparadigma anwendet. Aufgrund dieser Arbeitsteilung in den Fischern liegen sowohl die Subjektivität (Sinn 2) als auch das einzelne Subjekt (Sinn 1) auf der wissenschaftlichen Seite, nicht auf der statistischen Seite.
Legalistisch gesprochen, der Fishers Frequentism ist subjektiv. Es ist nur so, dass das subjektive Subjekt nicht der Statistiker ist.
Es gibt verschiedene Synthesen davon, sowohl die kaum kohärente Mischung aus diesen beiden, die Sie in Lehrbüchern für angewandte Statistik finden, als auch differenziertere Versionen, z. B. die von Deborah Mayo vorgelegte 'Fehlerstatistik'. Letzteres ist in Sinn 2 ziemlich unsubjektiv, in Sinn 1 jedoch höchst subjektiv, da der Forscher mit wissenschaftlichem Urteilsvermögen - im Fisher-Stil - herausfinden muss, welche Fehlerwahrscheinlichkeiten wichtig sind und getestet werden müssen.
Frequentismus als subjektiv (erster Sinn)
Ist der Frequentismus also im ersten Sinne weniger subjektiv? Es hängt davon ab, ob. Jede Inferenzprozedur kann mit tatsächlich angewendeten Eigenheiten durchsetzt sein. Vielleicht ist es also sinnvoller zu fragen, ob der Frequentismus einen weniger subjektiven (ersten Sinn) Ansatz fördert . Ich bezweifle es - ich denke, die selbstbewusste Anwendung subjektiver (zweiter Sinn) Methoden führt zu weniger subjektiven (erster Sinn) Ergebnissen, aber es kann so oder so argumentiert werden.
Nehmen Sie für einen Moment an, dass sich Subjektivität (erster Sinn) über "Entscheidungen" in eine Analyse einschleicht. Der Bayesianismus scheint mehr Wahlmöglichkeiten mit sich zu bringen. Im einfachsten Fall ergeben sich folgende Auswahlmöglichkeiten: eine Menge potenziell eigenwilliger Annahmen für den Frequentisten (die Wahrscheinlichkeitsfunktion oder ein Äquivalent) und zwei Mengen für den Bayesian (die Wahrscheinlichkeit und ein Prior gegenüber den Unbekannten).
Die Bayesianer wissen jedoch, dass sie bei all diesen Entscheidungen subjektiv sind (im zweiten Sinne), sodass sie sich der Auswirkungen, die zu weniger Subjektivität führen sollten (im ersten Sinne), eher bewusst sind.
Wenn man im Gegensatz dazu einen Test in einem großen Testbuch nachschlägt, könnte man das Gefühl bekommen, dass das Ergebnis weniger subjektiv ist (erster Sinn), aber das liegt wohl daran, dass man das Problemverständnis eines anderen Subjekts durch das eigene ersetzt . Es ist nicht klar, dass man auf diese Weise weniger subjektiv geworden ist, aber es könnte sich so anfühlen. Ich denke, die meisten würden zustimmen, dass das nicht hilfreich ist.