Denken Sie wie ein Bayesianer, überprüfen Sie wie ein Frequentist: Was bedeutet das?


35

Ich schaue mir einige Vorlesungsfolien zu einem datenwissenschaftlichen Kurs an, die hier zu finden sind:

https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf

Ich kann das Video für diesen Vortrag leider nicht sehen und an einer Stelle auf der Folie hat der Vortragende den folgenden Text:

Einige Grundprinzipien

Denken Sie wie ein Bayesianer, überprüfen Sie wie ein Frequentist (Versöhnung)

Weiß jemand, was das eigentlich bedeutet? Ich habe das Gefühl, dass es einen guten Einblick in diese beiden Denkschulen gibt, der sich daraus ergibt.


2
Denke, es könnte mit der Modellprüfung zu tun haben: siehe Warum darf ein Bayesianer die Residuen nicht betrachten? .
Scortchi

@Scortchi Aus meiner Sicht hat dies nicht mit der Trennung von Trainings-, Validierungs- und Testdatensätzen zu tun, oder möglicherweise darf ein Bayesianer die Prioritäten auch während der Trainingsphase des Modells nicht anpassen (um einen ML-Term zu verwenden) Hier). Allerdings bin ich immer noch verwirrt, was es bedeutet, wie ein Frequentist zu überprüfen ...
Luca

1
Ein "richtiger" Bayesianer passt seine Prioritäten niemals an, sondern aktualisiert sie nur anhand neuer Informationen unter Verwendung des Bayes'schen Theorems. Aber ich rate nur, worum es bei diesem "Schlüsselprinzip" gehen könnte.
Scortchi

4
Ich konnte den Link nicht laden. Ich vermute, dass sie bedeuten, dass Sie, selbst wenn Sie Bayes'sche Methoden anwenden, sich um die frequenzabhängigen Betriebseigenschaften kümmern sollten: Wenn Sie zu 95% glaubwürdige Intervalle erzeugen, die extrem eng sind, in der Praxis aber 20% der Zeit den eigentlichen interessierenden Parameter abdecken, solltest du besorgt sein Ein zu starrer Bayesianer könnte "nein" sagen (aber es gibt tatsächlich nur sehr wenige Bayesianer mit einer solchen Starrheit).
Cliff AB

3
Sie blicken in die Zukunft und befürworten Empirical Bayes. Dies ist auf den folgenden Dias zu sehen
Cliff AB,

Antworten:


32

Der Hauptunterschied zwischen der Bayes'schen und der frequentistischen Statistikschule ergibt sich aus einem Unterschied in der Interpretation der Wahrscheinlichkeit. Eine Bayes'sche Wahrscheinlichkeit ist eine Aussage über die persönliche Überzeugung, dass ein Ereignis eintreten wird (oder eingetreten ist). Eine frequentistische Wahrscheinlichkeit ist eine Aussage über den Anteil ähnlicher Ereignisse, die im Grenzfall auftreten, wenn die Anzahl dieser Ereignisse zunimmt.

"Denken wie ein Bayesianer" bedeutet für mich, Ihre persönliche Überzeugung zu aktualisieren, wenn neue Informationen auftauchen, und "überprüfen [oder sich sorgen] wie ein Frequentist" bedeutet, sich mit der Leistung statistischer Verfahren zu befassen, die über die Zeiträume hinweg aggregiert werden, in denen diese Verfahren angewendet werden. zB was ist die Abdeckung von glaubwürdigen Intervallen, was sind die Typ I / II Fehlerraten, etc.


1
Vielen Dank für Ihre Antwort. Prägnant und effektiv auch für Laien wie mich!
Luca

2
Kann man nicht wie ein Bayesianer prüfen oder sich Sorgen machen, indem man den Einfluss von Prioren untersucht oder einen nicht informativen verwendet? Gilt dies nur für sequentielle Analysen? Es gab eine Menge Arbeit darüber, wo sich Bayesianische und Frequentistische Statistiken mit sequentiellen Analysen überschneiden, "Aktualisierung der Überzeugungen" nicht wesentlich ist und sequenzielle Statistiken in der Umgebung der Frequentisten rigoros gemacht werden können.
AdamO

1
Ja, es ist möglich, sich wie ein Bayesianer zu sorgen, z. B. den Einfluss Ihres Prior zu untersuchen. Nein, meine Antwort gilt nicht nur für sequentielle Analysen, dh die neuen Informationen können auf einmal entstehen.
Jaradniemi

15

Die Bayes'schen Statistiken fassen die Überzeugungen zusammen, wohingegen die frequentistischen Statistiken die Beweise zusammenfassen. Die Bayesianer sehen Wahrscheinlichkeit als Grad des Glaubens. Diese integrative und generative Art der Argumentation ist nützlich für die Formulierung von Hypothesen. Beispielsweise können Bayesianer der Vorstellung, dass der Mond aus grünem Käse besteht, eine willkürliche Wahrscheinlichkeit zuweisen, unabhängig davon, ob Astronauten tatsächlich dorthin gereist sind, um dies zu überprüfen. Diese Hypothese wird vielleicht durch die Vorstellung gestützt, dass der Mond aus der Ferne aussiehtwie grüner Käse. Häufige Forscher können sich weder eine Hypothese vorstellen, die mehr ist als ein Strohmann, noch können sie behaupten, dass Beweise eine Hypothese einer anderen vorziehen. Sogar die maximale Wahrscheinlichkeit erzeugt nur eine Statistik, die "am besten mit dem übereinstimmt, was beobachtet wurde". Die Bayes'sche Statistik erlaubt es uns formal, über den Tellerrand hinaus zu denken und vertretbare Ideen aus Daten vorzuschlagen. Dies ist jedoch streng genommen eine Hypothese, die in der Natur entsteht.

Häufigkeitsstatistiken werden am besten angewendet, um Hypothesen zu bestätigen. Wenn ein Experiment gut durchgeführt wird, liefern die Frequentist-Statistiken einen "unabhängigen Beobachter" oder "empirischen" Kontext für die Ergebnisse, indem sie Priors meiden. Dies steht im Einklang mit der Karl-Popper-Wissenschaftsphilosophie. Der Beweispunkt ist nicht, eine bestimmte Idee zu verbreiten. Viele Beweise stimmen mit falschen Hypothesen überein . Beweise können lediglich Überzeugungen verfälschen.

Der Einfluss von Priors wird im Allgemeinen als Verzerrung der statistischen Argumentation angesehen. Wie Sie wissen, können wir eine Vielzahl von Gründen dafür nennen, warum etwas passiert. Psychologisch glauben viele Menschen, dass unsere Beobachterbias das Ergebnis von Vorurteilen in unserem Gehirn ist, die uns davon abhalten, das, was wir sehen, wirklich zu gewichten. "Hoffnung bewölkt Beobachtung", wie die Ehrwürdige Mutter in der Düne sagte. Popper machte diese Idee rigoros.

Dies hatte eine große historische Bedeutung in einigen der größten wissenschaftlichen Experimente unserer Zeit. Zum Beispiel John Snow für die Cholera - Epidemie akribisch Beweise gesammelt und festgestellt , dass astutely Cholera wird nicht durch moralischen Entzug verursacht, und wies darauf hin , dass die Beweise mit Abwasser Kontamination sehr konsistent waren: note ihn nicht schließenDiesbezüglich gingen die Erkenntnisse von Snow der Entdeckung von Bakterien voraus und es gab kein mechanistisches oder ätiologisches Verständnis. Ein ähnlicher Diskurs findet sich in Origin of Species. Wir wussten nicht wirklich, ob der Mond aus grünem Käse bestand, bis Astronauten tatsächlich auf der Oberfläche landeten und Proben sammelten. Zu diesem Zeitpunkt haben Bayesianische Posterioren jeder anderen Möglichkeit eine sehr, sehr geringe Wahrscheinlichkeit zugewiesen, und Frequentisten können bestenfalls sagen, dass die Proben mit nichts anderem als Mondstaub in hohem Maße inkonsistent sind.

Zusammenfassend lässt sich sagen, dass die Bayes'schen Statistiken für die Erstellung von Hypothesen und die Frequentist-Statistiken für die Bestätigung von Hypothesen geeignet sind. Es ist eine der größten Herausforderungen moderner Statistiker, dafür zu sorgen, dass die Daten bei diesen Bemühungen unabhängig erfasst werden.


1
Danke für die Antwort. Was meinten Sie , wenn Sie sagen Plenty of evidence is consistent with incorrect hypotheses.
Luca

2
@Luca Ein häufiges statistisches Beispiel könnte in Confounding gefunden werden. Zum Beispiel könnte ich sagen: "Rauchen verbessert die Lungenfunktion von Jugendlichen". Ich könnte dies noch weiter rationalisieren, indem ich sage, dass Rauchen ein Stimulans ist, das zu besserer körperlicher Aktivität, gesünderem Appetit und gesunder Sozialisation anregt. Wenn ich Daten gesammelt, würden sie zeigen in der Tat , dass Jugendliche , die rauchen Lunge bessere Funktion haben. Die assoziative Schlussfolgerung ist richtig, die kausale jedoch falsch. Die Beziehung ist altersbedingt verwechselt, da ältere Kinder eher rauchen.
AdamO

Vielen Dank! Ich habe viel aus dieser sehr gut geschriebenen Antwort gelernt.
Luca

5

Per Cliff AB's Kommentar zum OP, es hört sich so an, als würden sie sich einer empirischen Bayes'schen Philosophie nähern. Es gibt drei wesentliche Bayes'sche Denkrichtungen, und Empirical Bayes schätzt die Prioritäten anhand von Daten, häufig mit häufigeren Methoden. Das stimmt nicht genau mit dem Zitat überein (was darauf hindeutet, dass Bayes vorne steht und hinterher häufig auftritt), aber wir sollten nicht Cliff ABden hervorragenden Kommentar von Bayes übersehen .

Es gab und gibt möglicherweise auch eine Bayesianische Schule, bei der man nach einem Bayesianischen Eingriff nichts mehr überprüfen muss. Ein moderner Gedanke würde posteriore prädiktive Überprüfungen verwenden, und vielleicht bezieht sich das Zitat auf diese Art der Überprüfung Ihrer Antworten.

Auch beschäftigt sich die frequentistische Philosophie eher mit Prozeduren als mit Rückschlüssen aus Daten. Vielleicht ist das auch ein Hinweis auf die Bedeutung des Zitats.


Ich denke, Sie haben sich auf meinen ersten Kommentar bezogen, und mein zweiter Kommentar lautete, dass Sie bei näherer Betrachtung richtig sind, dass sie sich ganz spezifisch auf Empirical Bayes beziehen. Eigentlich war ich enttäuscht, dass das Zitat lediglich eine Bestätigung von Empirical Bayes war und nicht eine allgemeinere Aufforderung, die Vorteile beider Denkrichtungen zu berücksichtigen. Naja.
Cliff AB

2

Im Rahmen dieses datenwissenschaftlichen Unterrichts interpretiere ich "Scheck wie ein Frequentist" so, dass Sie die Leistung Ihrer Vorhersage- oder Entscheidungsfunktion anhand von durchgehaltenen Validierungsdaten bewerten. Der Rat, "wie ein Bayesianer zu denken", drückt die Meinung aus, dass eine aus einem Bayesianischen Ansatz abgeleitete Vorhersagefunktion im Allgemeinen gute Ergebnisse liefert.


(Devil's Advocate spielen :) Warum sollte Bayesian Ansatz "gute Ergebnisse" geben und Frequentist nicht?
Tim

Bayesianische Methoden beschreiben den Ansatz. Frequentistische Statistiken können als Teil der Entscheidungstheorie betrachtet werden und bieten einen Rahmen für die Bewertung jeder Entscheidungsfunktion (ob auf der Grundlage eines Bayes'schen oder eines frequentistischen Prinzips). Bestimmte Methoden, wie z. B. Maximum-Likelihood-Methoden, werden häufig in einem frequentistischen Kontext verwendet, weil sie gute frequentistische Eigenschaften haben (z. B. tun sie asymptotisch das Richtige und kommen schneller als die meisten anderen Methoden). Eine Bayes'sche Methode könnte sicherlich von einem Frequentisten angewendet werden, aber sie hätte unterschiedliche Gründe, sie anzuwenden.
DavidR

Bayesianische Methoden haben auch viele Gemeinsamkeiten mit der Entscheidungstheorie. Ich glaube auch nicht , dass Bayes'sche Methoden im frequentistischen Kontext verwendet werden können (wie würden Sie sich vorstellen, Priors im frequentistischen Kontext zu verwenden?) - es ist eher umgekehrt: Viele frequentistische Methoden haben Bayes'sche Interpretationen. Ich glaube nicht, dass es Sinn macht, darüber zu diskutieren, was ich sage, dass Ihre Aussagen die Dinge ein wenig vereinfachen.
Tim

In Bezug auf Bayes'sche Ansätze kann man viele nette Eigenschaften von Frequentisten nachweisen. In diesem Sinne ist es ziemlich sicher, etwas Bayes'sches zu tun, solange Sie über genügend Daten verfügen.
DavidR

1
Angenommen, ich möchte die Wahrscheinlichkeit p der Köpfe bei einem Münzwurf schätzen. Als Bayesianer würde ich mit einer Prioritätsangabe für die Wahrscheinlichkeit p beginnen, einige Daten beobachten und dann einen Posterior für p erhalten. Wir müssen eine Punktschätzung von p ausarbeiten, und ich entscheide mich, den Mittelwert meiner hinteren Verteilung als meine Punktschätzung zu verwenden. Insgesamt beschreibt dies eine Methode, um von Daten zu einer Punktschätzung zu gelangen. Diese Methode kann häufig bewertet werden: zB ist sie voreingenommen? konsistent? asymptotisch effizient? Die Tatsache, dass ein Prior beteiligt war, sollte per se den Frequentisten nicht betreffen.
DavidR

1

Es klingt wie "denke wie ein Bayesianer, überprüfe wie ein Frequentist", bezieht sich auf den eigenen Ansatz bei der statistischen Gestaltung und Analyse. So wie ich es verstehe, beinhaltet das Bayes'sche Denken einen gewissen Glauben an frühere Situationen (experimentell oder statistisch). Nehmen wir zum Beispiel an, dass die durchschnittliche Leseleistung für Viertklässler 80 Wörter pro Minute beträgt und dass einige Eingriffe diese Zahl auf 90 Wörter pro Minute erhöhen könnten . Dies sind Überzeugungen, die auf früheren Studien und Hypothesen beruhen. Frequentistisches Denken extrapoliert die Ergebnisse (der Intervention), um Konfidenzintervalle oder andere Statistiken zu erhalten, die auf der theoretischen und praktischen Häufigkeit oder Wahrscheinlichkeit basieren, mit der diese Ergebnisse erneut auftreten (dh wie häufig). Zum Beispiel könnte der Lesewert nach dem Eingriff 91 Wörter pro Minute mit einem 95% -Konfidenzintervall von 85 bis 97 Wörtern pro Minute betragen, und ein zugehöriger p-Wert (Wahrscheinlichkeitswert) davon unterscheidet sich vom Wert vor dem Eingriff. In 95% der Fälle liegen die neuen Lesewerte nach dem Eingriff zwischen 85 und 97 Wörtern pro Minute. Deshalb "denke wie ein Bayesianer", dh theoretisiere, hypothetisiere, betrachte frühere Beweise und "überprüfe wie ein Frequentist", dh wie häufig würden diese experimentellen Ergebnisse auftreten und wie wahrscheinlich ist, dass sie darauf zurückzuführen sind eher Zufall als Intervention. Die neuen Lesewerte würden nach dem Eingriff zwischen 85 und 97 Wörtern pro Minute liegen. Deshalb "denke wie ein Bayesianer", dh theoretisiere, hypothetisiere, betrachte frühere Beweise und "überprüfe wie ein Frequentist", dh wie häufig würden diese experimentellen Ergebnisse auftreten und wie wahrscheinlich ist, dass sie darauf zurückzuführen sind eher Zufall als Intervention. Die neuen Lesewerte würden nach dem Eingriff zwischen 85 und 97 Wörtern pro Minute liegen. Deshalb "denke wie ein Bayesianer", dh theoretisiere, hypothetisiere, betrachte frühere Beweise und "überprüfe wie ein Frequentist", dh wie häufig würden diese experimentellen Ergebnisse auftreten und wie wahrscheinlich ist, dass sie darauf zurückzuführen sind eher Zufall als Intervention.


2
Ihr letzter Satz - der Teil "Check like a frequentist" - hat wirklich nichts mit der Einstellung "Frequentist" zu tun: Die Bayes'sche Schätzung würde Ihnen auch sagen, "wie häufig" wir damit rechnen, dass etwas passiert, oder "wie wahrscheinlich" es ist ...
Tim
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.