Nach dem, was ich gelesen habe und nach Antworten auf andere Fragen, die ich hier gestellt habe, entsprechen viele sogenannte frequentistische Methoden mathematisch (es ist mir egal, ob sie philosophisch korrespondieren , es ist mir nur wichtig, ob sie mathematisch entsprechen) speziellen Fällen von sogenannten Bayesianische Methoden (für diejenigen, die dagegen sind, siehe den Hinweis am Ende dieser Frage). Diese Antwort auf eine verwandte Frage (nicht meine) stützt diese Schlussfolgerung:
Die meisten häufig vorkommenden Methoden haben ein Bayes'sches Äquivalent, das unter den meisten Umständen im Wesentlichen das gleiche Ergebnis liefert.
Beachten Sie, dass im Folgenden mathematisch gleich zu sein bedeutet, dasselbe Ergebnis zu erzielen. Wenn Sie zwei Methoden charakterisieren, von denen nachgewiesen werden kann, dass sie immer die gleichen Ergebnisse als "unterschiedlich" liefern, ist dies Ihr Recht, aber dies ist ein philosophisches Urteil, weder ein mathematisches noch ein praktisches.
Viele Menschen, die sich selbst als "Bayesianer" beschreiben, scheinen jedoch unter keinen Umständen die Verwendung der Maximum-Likelihood-Schätzung abzulehnen, obwohl dies ein Sonderfall von ( mathematisch ) Bayes'schen Methoden ist, da es sich um eine "frequentistische Methode" handelt. Anscheinend verwenden Bayesianer im Vergleich zu Frequentisten auch eine begrenzte Anzahl von Verteilungen, obwohl diese Verteilungen auch aus Bayes'scher Sicht mathematisch korrekt wären .
Frage: Wann und warum lehnen Bayesianer Methoden ab, die aus Bayes'scher Sicht mathematisch korrekt sind? Gibt es eine Rechtfertigung dafür, die nicht "philosophisch" ist?
Hintergrund / Kontext: Das Folgende sind Zitate aus Antworten und Kommentaren zu einer früheren Frage von mir auf CrossValidated :
Die mathematische Grundlage für die Debatte zwischen Bayes und Frequentisten ist sehr einfach. In der Bayes'schen Statistik wird der unbekannte Parameter als Zufallsvariable behandelt. in der frequentistischen Statistik wird es als festes Element behandelt ...
Aus dem Vorstehenden wäre ich zu dem Schluss gekommen, dass ( mathematisch gesehen ) Bayes'sche Methoden allgemeiner sind als frequentistische, in dem Sinne, dass frequentistische Modelle alle gleichen mathematischen Annahmen erfüllen wie Bayes'sche, aber nicht umgekehrt. Dieselbe Antwort argumentierte jedoch, dass meine Schlussfolgerung aus dem oben Gesagten falsch war (die Betonung im Folgenden liegt bei mir):
Obwohl die Konstante ein Sonderfall einer Zufallsvariablen ist, würde ich zögern zu schließen, dass der Bayesianismus allgemeiner ist. Sie würden keine häufig auftretenden Ergebnisse von Bayes'schen erhalten, wenn Sie die Zufallsvariable einfach auf eine Konstante reduzieren. Der Unterschied ist tiefer ...
Zu persönlichen Vorlieben gehen ... Ich mag es nicht, dass die Bayes'sche Statistik eine ziemlich eingeschränkte Teilmenge der verfügbaren Distributionen verwendet.
Ein anderer Benutzer, in ihrer Antwort, das Gegenteil festgestellt, dass Bayes - Methoden sind allgemeinere, obwohl seltsam genug der beste Grund , warum ich für nicht finden könnte , warum dies der Fall in der vorherige Antwort war sein könnte, von jemandem gegeben als frequentistischen ausgebildet.
Die mathematische Konsequenz ist, dass Frequentisten glauben, dass die Grundgleichungen der Wahrscheinlichkeit nur manchmal gelten, und Bayesianer denken, dass sie immer gelten. Sie sehen die gleichen Gleichungen als richtig an, unterscheiden sich jedoch darin, wie allgemein sie sind ... Bayesian ist streng allgemeiner als Frequentist. Da über jede Tatsache Unsicherheit bestehen kann, kann jeder Tatsache eine Wahrscheinlichkeit zugewiesen werden. Insbesondere wenn sich die Fakten, an denen Sie arbeiten, auf Frequenzen der realen Welt beziehen (entweder als etwas, das Sie vorhersagen, oder als Teil der Daten), können Bayes'sche Methoden sie genauso berücksichtigen und verwenden wie jede andere reale Tatsache. Folglich kann jedes Problem, an dem Frequentisten glauben, dass ihre Methoden auf Bayesianer angewendet werden, auch auf natürliche Weise bearbeitet werden.
Aus den obigen Antworten habe ich den Eindruck, dass es mindestens zwei verschiedene Definitionen des häufig verwendeten Begriffs Bayesian gibt. Das erste würde ich "mathematisch Bayesian" nennen, das alle Methoden der Statistik umfasst, da es Parameter enthält, die konstante RVs sind und solche, die keine konstanten RVs sind. Dann gibt es "kulturell Bayesian", das einige "mathematisch Bayesian" -Methoden ablehnt, weil diese Methoden "frequentistisch" sind (dh aus persönlicher Feindseligkeit gegenüber dem Parameter, der manchmal als Konstante oder Frequenz modelliert wird). Eine andere Antwort auf die oben genannte Frage scheint diese Vermutung ebenfalls zu stützen:
Es ist auch anzumerken, dass es zwischen den Modellen, die von den beiden Lagern verwendet werden, viele Unterschiede gibt, die mehr mit dem zu tun haben, was getan wurde als mit dem, was getan werden kann (dh viele Modelle, die traditionell von einem Lager verwendet werden, können vom anderen Lager gerechtfertigt werden ).
Ich denke, eine andere Möglichkeit, meine Frage zu formulieren, wäre die folgende: Warum nennen sich kulturelle Bayesianer Bayesianer, wenn sie viele mathematisch Bayesianische Methoden ablehnen? Und warum lehnen sie diese mathematisch Bayes'schen Methoden ab? Ist es persönliche Feindseligkeit für die Menschen, die diese speziellen Methoden am häufigsten anwenden?
Bearbeiten: Zwei Objekte sind im mathematischen Sinne äquivalent, wenn sie dieselben Eigenschaften haben , unabhängig davon, wie sie aufgebaut sind. Zum Beispiel kann ich mir mindestens fünf verschiedene Möglichkeiten vorstellen, um die imaginäre Einheit zu konstruieren . Dennoch gibt es nicht mindestens fünf verschiedene "Denkschulen" zum Studium imaginärer Zahlen; Tatsächlich glaube ich, dass es nur eine gibt, nämlich die Gruppe, die ihre Eigenschaften untersucht. Für diejenigen, die Einwände erheben, dass das Erhalten einer Punktschätzung unter Verwendung der maximalen Wahrscheinlichkeit nicht dasselbe ist wie das Erhalten einer Punktschätzung unter Verwendung des Maximums a priori und eines einheitlichen Prior, da die beteiligten Berechnungen unterschiedlich sind, ich zu, dass sie sich in einer philosophischen Sinne unterscheiden, sondern zu das Ausmaß, dass sie immerGeben Sie die gleichen Werte für die Schätzung an, sie sindmathematisch äquivalent, weil sie die gleichen Eigenschaften haben . Vielleicht ist der philosophische Unterschied für Sie persönlich relevant, aber für diese Frage ist er nicht relevant.
Hinweis: Diese Frage hatte ursprünglich eine falsche Charakterisierung der MLE-Schätzung und der MAP-Schätzung mit einem einheitlichen Prior.