Wenn jemand sagte
"Dieses Verfahren verwendet die MLE- Punktschätzung für den Parameter, der maximiert , daher ist es häufig; und außerdem ist es nicht bayesianisch."
würdest du zustimmen?
- Update zum Hintergrund : Ich habe kürzlich eine Zeitung gelesen, die behauptet, häufig zu sein. Ich bin mit ihrer Behauptung nicht einverstanden, bestenfalls bin ich der Meinung, dass sie mehrdeutig ist. In dem Papier wird weder die MLE (noch die MAP) ausdrücklich erwähnt ) . Sie nehmen nur eine Punktschätzung vor und gehen einfach so vor, als ob diese Punktschätzung wahr wäre. Sie tun es nichtAnalysieren Sie die Stichprobenverteilung dieses Schätzers oder ähnliches. Das Modell ist recht komplex und daher ist eine solche Analyse wahrscheinlich nicht möglich. Sie verwenden das Wort "posterior" auch zu keinem Zeitpunkt. Sie nehmen einfach diese Punktschätzung zum Nennwert und fahren mit ihrem Hauptinteressenthema fort - Ableiten fehlender Daten. Ich glaube nicht, dass ihre Herangehensweise einen Hinweis auf ihre Philosophie gibt. Sie haben vielleicht vorgehabt, häufig zu sein (weil sie sich verpflichtet fühlen, ihre Philosophie im Ärmel zu tragen), aber ihr tatsächlicher Ansatz ist recht einfach / bequem / faul / mehrdeutig. Ich bin jetzt geneigt zu sagen, dass die Forschung eigentlich keine Philosophie hat; stattdessen denke ich, dass ihre Haltung pragmatischer oder bequemer war:
Ich habe Daten beobachtet, , und ich möchte einige fehlende Daten abschätzen, . Es gibt einen Parameter der die Beziehung zwischen und steuert . mir eigentlich egal, außer als Mittel zum Zweck ich habe eine Schätzung für wird es leichter vorherzusagen , von ich werde eine Punktschätzung von wählen. , weil es bequem ist, insbesondere werde ich die wählen θ , die maximiert P ( x | θ ) .“
In Bayes'schen Methoden sind die Rollen der Daten und des Parameters umgekehrt. Insbesondere bedingen wir nun die beobachteten Daten und fahren fort, Rückschlüsse auf den Wert des Parameters zu ziehen. Dies erfordert eine vorherige.
So weit so gut, aber wo passt die MLE (Maximum Likelihood Estimation) in all das? Ich habe den Eindruck, dass viele Leute meinen, es sei ein Frequentist (oder genauer gesagt, es ist kein Bayesianer). Aber ich fühle , dass es Bayes ist , weil es die beobachteten Daten beinhaltet nehmen und dann das Finden der Parameter, der maximiert . Die MLE verwendet implizit eine einheitliche Priorisierung und Konditionierung der Daten und eine Maximierung von P ( p a r a m e t e . Ist es fair zu sagen, dass die MLE sowohl frequentistisch als auch bayesianisch aussieht? Oder muss jedes einfache Werkzeug genau in eine dieser beiden Kategorien fallen?
Die MLE ist konsistent, aber ich bin der Meinung, dass Konsistenz als bayesianische Idee dargestellt werden kann. Bei beliebig großen Stichproben konvergiert die Schätzung mit der richtigen Antwort. Die Aussage "Die Schätzung entspricht dem wahren Wert" gilt für alle Werte des Parameters. Das Interessante ist, dass diese Aussage auch dann zutrifft, wenn Sie die beobachteten Daten als Bayes'sch bezeichnen. Diese interessante Seite gilt für die MLE, aber nicht für einen unvoreingenommenen Schätzer.
Aus diesem Grund bin ich der Meinung, dass die MLE die "Bayesianischste" Methode ist, die man als Frequentist bezeichnen könnte.
Auf jeden Fall gelten die meisten Frequentist-Eigenschaften (wie Unparteilichkeit) in allen Fällen, einschließlich endlicher Stichprobengrößen. Die Tatsache, dass Konsistenz nur im unmöglichen Szenario (unendliche Stichprobe innerhalb eines Experiments) gilt, legt nahe, dass Konsistenz keine so nützliche Eigenschaft ist.
Gibt es bei einer realistischen (dh endlichen) Stichprobe eine Frequentist-Eigenschaft, die für die MLE gilt? Wenn nicht, ist der MLE nicht wirklich Frequentist.