Bayesianische uninformative Priors vs. frequentistische Nullhypothesen: Wie ist die Beziehung?


11

Ich bin auf dieses Bild in einem Blog-Beitrag hier gestoßen .

Jemand in einer Mosh-Grube erlebt einen EUREKA!  Moment

Ich war enttäuscht, dass das Lesen der Aussage für mich nicht den gleichen Gesichtsausdruck hervorrief wie für diesen Kerl.

Was ist also mit der Aussage gemeint, dass die Nullhypothese lautet, wie Frequentisten einen nicht informativen Prior ausdrücken? Ist es wirklich wahr?


Bearbeiten: Ich hoffe, jemand kann eine gemeinnützige Interpretation anbieten, die die Aussage wahr macht, auch in einem losen Sinne.


3
Ich denke nicht, dass es richtig ist. Kann jemand zuerst die Wahrscheinlichkeit eines T-Tests aufschreiben? Dann können wir über Analogien sprechen. Nun, und wenn Sie nicht können ... werden wir, dass das Bild keinen Sinn ergibt.
Joint_P

Antworten:


10

Die Nullhypothese ist nicht gleichbedeutend mit einem nicht informativen Bayes'schen Prior, aus dem einfachen Grund, dass Bayesianer auch Nullhypothesen verwenden und Hypothesentests unter Verwendung von Bayes'schen Faktoren durchführen können. Wenn sie gleichwertig wären, würden die Bayesianer keine Nullhypothesen verwenden.

Sowohl häufig auftretende als auch Bayes'sche Hypothesentests beinhalten jedoch ein Element der Selbstskepsis, da wir nachweisen müssen, dass es einige Beweise dafür gibt, dass unsere alternative Hypothese in gewisser Weise eine plausibelere Erklärung für die Beobachtungen ist als der Zufall. Frequentisten tun dies, indem sie ein Signifikanzniveau haben, Bayesianer tun dies, indem sie eine Interpretationsskala für den Bayes-Faktor haben, so dass wir eine Hypothese nicht stark verbreiten würden, wenn der Bayes-Faktor über der Nullhypothese nicht ausreichend hoch wäre.

Der Grund, warum frequentistische Hypothesentests kontraintuitiv sind, liegt darin, dass ein Frequentist der Wahrheit einer Hypothese keine nicht triviale Wahrscheinlichkeit zuweisen kann, was leider im Allgemeinen das ist, was wir eigentlich wollen. Am ehesten können sie dies erreichen, indem sie den p-Wert (die Wahrscheinlichkeit der Beobachtungen unter H0) berechnen und daraus eine subjektive Schlussfolgerung ziehen , ob H0 oder H1 plausibel sind. Der Bayesianer kann der Wahrheit einer Hypothese eine Wahrscheinlichkeit zuweisen und so das Verhältnis dieser Wahrscheinlichkeiten berechnen, um einen Hinweis auf ihre relativen Plausibilitäten zu geben, oder zumindest darauf, wie die Beobachtungen das Verhältnis dieser Wahrscheinlichkeiten ändern (was a Bayes-Faktor tut).

Meiner Meinung nach ist es eine schlechte Idee, eine zu enge Parallele zwischen den Testmethoden für häufig auftretende und Bayes'sche Hypothesen zu ziehen, da diese grundlegend unterschiedlich sind und grundlegend unterschiedliche Fragen beantworten. Wenn sie so behandelt werden, als wären sie gleichwertig, wird eine Bayes'sche Interpretation des häufig auftretenden häufig auftretenden Tests (z. B. des p-Wert-Irrtums) gefördert (zum Beispiel gehen Klimaskeptiker häufig davon aus, dass das Fehlen eines statistisch signifikanten Trends bei der globalen mittleren Oberflächentemperatur dies bedeutet war keine Erwärmung - was überhaupt nicht richtig ist).


9

Der Grund, warum du nicht den gleichen epiphanischen Ausdruck auf deinem Gesicht hast wie dieser Typ, ist, dass ich das denke. . . Die Aussage ist nicht wahr.

Eine Nullhypothese ist die Hypothese, dass jeder Unterschied zwischen den Kontroll- und Versuchsbedingungen zufällig ist.

Ein nicht informativer Prior soll angeben, dass Sie über vorherige Daten zu einer Frage verfügen, dass er Ihnen jedoch nichts darüber sagt, was Sie beim nächsten Mal erwarten können. Ein Bayesianer wird wahrscheinlich behaupten, dass es Informationen in jedem früheren gibt, sogar in der gleichmäßigen Verteilung.

Die Nullhypothese besagt also, dass es keinen Unterschied zwischen Kontrolle und Experiment gibt. Ein nicht informativer Prior kann andererseits möglich sein oder auch nicht, und wenn dies der Fall wäre, würde dies nichts über den Unterschied zwischen Kontrolle und Experiment anzeigen (was sich von dem Hinweis unterscheidet, dass ein Unterschied zufällig ist).

Vielleicht fehlt mir jedoch mein Verständnis für nicht informative Prioritäten. Ich freue mich auf weitere Antworten.


2
Ich möchte nur hinzufügen, dass es bei nicht informativen Prioritäten mehr um die Einstellung des Forschers geht als um besonders interessante Eigenschaften der Verteilung selbst. Dies ist die Haltung, für die Gelman in der Bayesianischen Datenanalyse argumentiert, obwohl ich die Seitenzahl anscheinend nicht finden kann.
Sycorax sagt Reinstate Monica

7
Die Nullhypothese ist nicht immer dieselbe. Die Nullhypothese ist nur eine alternative "langweilige" Hypothese, die Sie mit Ihrer "interessanten" Hypothese vergleichen, um festzustellen, ob die Daten einander unterstützen. Eigentlich ist "kein Unterschied" eine schlechte Nullhypothese, da Sie a priori wissen, dass sie falsch ist. Besser ist "der Unterschied liegt unter einer Schwelle meiner Fürsorge".
Stumpy Joe Pete

Vielen Dank für die Antwort @Krysta, und ich hatte im Grunde die gleichen Gedanken zu der Aussage, aber vielleicht gibt es einen Sinn, in dem die Aussage irgendwie wahr ist?
Jerad

Meine beste Vermutung ist, dass die Nullhypothese der Ausgangspunkt für Frequentisten ist, oder die leere Menge von Hypothesen?; Vielleicht glaubt dieser Autor, dass der nicht informative Prior der Ausgangspunkt für Bayesianer ist, aber ein regelmäßiger informativer Prior ist ein besseres Analogon, wenn sie das meinen. Nullhypothese und nicht informativer Prior haben konzeptionelle Ähnlichkeiten - beide gehen davon aus, keine Informationen / Effekte anzunehmen. Aber das ist ziemlich vage!
Krysta

"Ein Bayesianer wird wahrscheinlich behaupten, dass es Informationen in einem früheren gibt". Ein Prior von Jeffreys ist jedoch nicht informativ.
Neil G

4

Siehe diesen Wikipedia-Artikel :

Für den Fall eines einzelnen Parameters und von Daten, die in einer einzigen ausreichenden Statistik zusammengefasst werden können, kann gezeigt werden, dass das glaubwürdige Intervall und das Konfidenzintervall zusammenfallen, wenn der unbekannte Parameter ein Standortparameter (...) mit einem vorherigen ist ist eine gleichmäßige flache Verteilung (...) und auch, wenn der unbekannte Parameter ein Skalenparameter (...) mit einem Jeffreys-Prior ist.

In der Tat verweist der Verweis auf Jaynes:

Jaynes, ET (1976), Konfidenzintervalle gegen Bayes'sche Intervalle .

Auf Seite 185 finden Sie:

Wenn Fall (I) auftritt (und dies öfter als erwartet), werden uns die Bayes'schen und orthodoxen Tests zu genau den gleichen Ergebnissen und der gleichen Schlussfolgerung führen, mit einer verbalen Meinungsverschiedenheit darüber, ob wir 'Wahrscheinlichkeit' oder 'verwenden' sollten. Bedeutung ', um sie zu beschreiben.

Tatsächlich gibt es also ähnliche Fälle, aber ich würde nicht sagen, dass die Aussage im Bild wahr ist, wenn Sie beispielsweise eine Cauchy-Verteilung als Wahrscheinlichkeit verwenden ...


4

Ich bin derjenige, der die Grafik erstellt hat, obwohl es, wie im beigefügten Beitrag erwähnt, ursprünglich nicht meine Einsicht ist. Lassen Sie mich einen Kontext für die Entstehung angeben und mein Bestes geben, um zu erklären, wie ich es verstehe. Die Erkenntnis erfolgte während einer Diskussion mit einem Studenten, der bis zu diesem Zeitpunkt hauptsächlich den Bayes'schen Inferenzansatz gelernt hatte. Es fiel ihm schwer, das gesamte Paradigma des Hypothesentests zu verstehen, und ich tat mein Bestes, um diesen ausgesprochen verwirrenden Ansatz zu erklären (wenn Sie „Unterschied“ als negativ betrachten - wie in nichtgleich - dann ist der Standard-Nullhypothesenansatz dreifach negativ: Ziel der Forscher ist es zu zeigen, dass es keinen Unterschied gibt). Im Allgemeinen und wie in einer anderen Antwort angegeben, erwarten die Forscher normalerweise einen gewissen Unterschied. Was sie wirklich hoffen zu finden, sind überzeugende Beweise, um die Null „abzulehnen“. Um unvoreingenommen zu sein, täuschen sie zunächst im Wesentlichen Unwissenheit vor, wie in „Nun, vielleicht hat diese Droge keine Wirkung auf Menschen.“ Dann zeigen sie durch Datenerfassung und -analyse (wenn sie können), dass diese Nullhypothese angesichts der Daten eine schlechte Annahme war.

Für einen Bayesianer muss dies wie ein verschlungener Ausgangspunkt erscheinen. Warum beginnen Sie nicht einfach damit, Ihre früheren Überzeugungen direkt anzukündigen, und machen Sie sich klar, was Sie annehmen (und was nicht), indem Sie es in einem früheren kodieren? Ein entscheidender Punkt hierbei ist, dass ein einheitlicher Prior dies nicht istdas gleiche wie ein nicht informativer Prior. Wenn ich 1000 Mal eine Münze werfe und 500 Köpfe bekomme, weist mein neuer Prior Kopf und Zahl das gleiche (gleichmäßige) Gewicht zu, aber seine Verteilungskurve ist sehr steil. Ich verschlüssele zusätzliche Informationen, die sehr informativ sind! Ein wahrer uninformativer Prior (bis an die Grenze) würde überhaupt kein Gewicht haben. Es bedeutet praktisch, von vorne zu beginnen und, um einen häufigeren Ausdruck zu verwenden, die Daten für sich selbst sprechen zu lassen. Die Beobachtung von "Clarence" war, dass der häufigste Weg, diesen Mangel an Informationen zu kodieren, die Nullhypothese ist. Es ist nichtgenau das gleiche wie ein nicht informativer Prior; Es ist der häufigere Ansatz, maximale Unwissenheit auf ehrliche Weise auszudrücken, der nicht voraussetzt, was Sie beweisen möchten.


2
Die frequentistische Nullhypothese drückt keine maximale Ignoranz aus, sie geht davon aus, dass die Nullhypothese wahr ist, und wir sollten mit der alternativen Hypothese nur fortfahren, wenn die Beobachtungen unter H0 ausreichend unwahrscheinlich sind. Es könnte argumentiert werden, dass das Testen von Nullhypothesen einige frühere codiert, aber es ist ausgesprochen informativ. Meiner Meinung nach ist der Versuch, häufig auftretende Hypothesentests in Bayes'schen Begriffen zu interpretieren, falsch und ein Rezept für Fehler. Sie sind keine Antworten auf dieselbe Frage.
Dikran Beuteltier

@Dikran Marsupial Dies ist bis zu einem gewissen Grad eine endlose Debatte, aber aus der häufigsten Perspektive sehe ich keine Möglichkeit, die Null als "ausgesprochen informativ" anzusehen. Wenn dies der Fall wäre, würde das Nicht-Ablehnen der Null als Beweis für die Null angesehen (da wir "bereits" Informationen über die Null haben). IMO versuchen alle Inferenzansätze, die gleichen miteinander verbundenen Fragen zu beantworten: "Wie sollen die Daten interpretiert werden?" und "wie stark ist der Fall?"
Matt Asher

1
Die Null selbst ist nicht informativ oder nicht informativ, aber das Testen herkömmlicher häufig auftretender Hypothesen ist von Natur aus (und zu Recht) auf das H0 ausgerichtet (es sei denn, Sie führen auch eine Leistungsanalyse durch). Diese Tendenz kann mit einer früheren verglichen werden, wäre jedoch informativ. Es ist einfach nicht sinnvoll, Prioritäten und Hypothesen zu vergleichen, sie dienen unterschiedlichen Zwecken in der Analyse. Hinweis Bayesian verwendet auch Nullhypothesen beim Testen von Hypothesen (siehe meine Antwort auf die Frage), wo sie denselben Zweck erfüllen wie beim Testen von häufig auftretenden Hypothesen.
Dikran Beuteltier

3
Um klar zu sein, verwenden wir am Beispiel der Droge nicht die Unwissenheit "Nun, vielleicht hat diese Droge keine Wirkung auf Menschen.", Wir gehen zunächst davon aus, dass die Nullhypothese korrekt ist. "Die Droge hat keine Wirkung und ist hoch an das Pharmaunternehmen, um festzustellen, dass es eine Wirkung hat, indem es zeigt, dass die Ergebnisse nicht durch zufälligen Zufall angemessen erklärt werden können ". Die Selbstskepsis, die dieser Ansatz bietet, ist der Grund, warum das "Nullritual" trotz seiner vielen Fehler in der Wissenschaft immer noch von praktischem Wert ist.
Dikran Beuteltier
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.