Ich habe versucht, die Bayes'schen Statistiken neu zu lernen (jedes Mal, wenn ich dachte, ich hätte sie endlich bekommen, taucht etwas anderes auf, das ich vorher nicht in Betracht gezogen habe ...), aber es war (für mich) nicht klar, wie der Datengenerierungsprozess ablief im Bayesianischen Rahmen ist eigentlich.
Der frequentistische Rahmen ist mir klar. Es gibt einige "wahre" Parameter und dieser Parameter generiert die Daten gemäß der Verteilung, die er parametrisiert.
In der Bayes'schen Einstellung modellieren wir den Parameter jedoch als Zufallsvariable. Dieser Teil verwirrt mich nicht. Es ist sinnvoll, weil ein Bayesianer diese Wahrscheinlichkeit als Unsicherheit in seinen eigenen Überzeugungen interpretiert. Sie können nicht wiederholbaren Ereignissen eine Wahrscheinlichkeit zuweisen. Die Art und Weise, wie ich "Bayesianismus" interpretierte, war, dass es glaubt, dass es einige Parameter gibt, die die Daten erzeugen. Es ist definitiv unbekannt, aber dennoch festgelegt, sobald es von "Natur" entschieden wurde (und vielleicht hat die Natur zufällig entschieden, was es angenommen wurde sein). Trotzdem ist es behoben und daher war die Erstellung ein "nicht wiederholbares Ereignis". Obwohl es nicht wiederholbar war, versuchen wir nur, unseren eigenen Glauben an θ zu aktualisierengegebenen Daten. Daher könnten die Daten durch einen der Parameter generiert worden sein, die von unserer Wahrscheinlichkeitsverteilung (vorher) berücksichtigt wurden, aber dennoch ist der Parameter fest und unbekannt. Wir fügen ihm nur einen Wahrscheinlichkeitswert hinzu.
Aus dieser Sicht ist es für mich sinnvoll anzunehmen, dass der Datengenerierungsprozess nahezu identisch mit dem des Frequentisten ist. "Natur" wählt den Parameter Verwendung der "wahren" "vorherigen" Verteilung P ∗ ( θ ) aus und sobald die Zufallsvariable ihre "wahre" (aber feste) Realisierung erreicht hat, beginnt sie, die beobachteten Daten zu erzeugen.
Ist dies die Standardmethode zur Interpretation des Datengenerierungsprozesses im Bayes'schen Rahmen?
Die Hauptsache meiner Ansicht ist, dass der Parameter definitiv festgelegt ist (als Realisierung eines rv angesehen) und die Daten gemäß θ erzeugt . Ein weiterer sehr wichtiger Punkt meiner Ansicht nach ist daher, dass unser Prior für mich nur eine quantifizierbare Möglichkeit ist, unsere Unsicherheit über das feste (und nicht wiederholbare) Ereignis der Erzeugung des Parameters θ auszudrücken . Interpretieren die Leute so das vorherige P ( θ ) ?
Humorvolle Randnotiz:
Ich wünschte, ich könnte einfach "Nature" fragen, wie sie es macht und dies ein für alle Mal regeln ... lol.