Wenn Sie einen Bayes'schen Ansatz wählen und Parameter behandeln, die die Verteilung von als zufällige Variable / Vektor beschreiben, sind die Beobachtungen zwar nicht unabhängig, aber bei Kenntnis von θ wären sie bedingt unabhängig , daher P ( X n ∣ X n - 1 , … X 1 , θ ) = P ( X n ≤ θ ) würde gelten.XθP(Xn∣Xn−1,…X1,θ)=P(Xn∣θ)
In einem klassischen statistischen Ansatz, ist nicht eine Zufallsvariable. Berechnungen werden so durchgeführt, als ob wir wissen, was θ ist. In gewissem Sinne konditionieren Sie immer auf θ (auch wenn Sie den Wert nicht kennen).θθθ
Als Sie geschrieben haben, "... geben Sie Informationen über die Verteilungsstruktur und als Ergebnis über ", haben Sie implizit einen Bayes'schen Ansatz gewählt, dies jedoch nicht genau getan. Sie schreiben eine Eigenschaft von IID-Samples, die ein Frequentist schreiben würde, aber die entsprechende Aussage in einem Bayes'schen Setup würde die Konditionierung von θ beinhalten .Xnθ
Bayesian vs. Klassische Statistiker
Sei das Ergebnis des Umwerfens einer einseitigen, unfairen Münze. Wir wissen nicht, mit welcher Wahrscheinlichkeit die Münze landet.xi
- Für den klassischen Statistiker ist der Frequentist ein Parameter, nennen wir ihn θ . Beachten Sie, dass θ hier ein Skalar ist, wie die Zahl 1/3. Wir wissen vielleicht nicht, was die Nummer ist, aber es ist eine Nummer! Es ist nicht zufällig!P(xi=H)θθ
- Für den Bayes'schen Statistiker ist selbst eine Zufallsvariable! Das ist extrem anders!θ
Die Schlüsselidee dabei ist, dass der Bayes-Statistiker die Wahrscheinlichkeitswerkzeuge auf Situationen ausdehnt, in denen der klassische Statistiker dies nicht tut . Für den Frequentisten ist keine Zufallsvariable, da es nur einen möglichen Wert hat ! Mehrfachnennungen sind nicht möglich! In der Vorstellung des Bayesian sind jedoch mehrere Werte von θ möglich, und der Bayesianer ist bereit, diese Unsicherheit (in seinem eigenen Verstand) unter Verwendung der Wahrscheinlichkeitswerkzeuge zu modellieren.θθ
Wohin geht das?
n
P(xn=H∣xn−1,xn−2,…,x1)=P(xn=H)=θ
θ
Eine Bayesianerin mit einer tiefen subjektiven Wahrscheinlichkeit würde sagen, dass die Wahrscheinlichkeit aus ihrer Perspektive wichtig ist ! . Wenn sie 10 Köpfe in einer Reihe sieht, ist ein 11. Kopf wahrscheinlicher, weil 10 Köpfe in einer Reihe einen dazu veranlassen, zu glauben, dass die Münze zugunsten der Köpfe schief steht.
P(x11=H∣x10=H,x9=H,…,x1=H)>P(x1=H)
θθθ
P(x11=H∣x10=H,x9=H,…,x1=H,θ)=P(x1=H∣θ)=θ
θθ
Weitere Hinweise
Ich habe mein Bestes gegeben, um hier ein kurzes Intro zu geben, aber was ich getan habe, ist bestenfalls recht oberflächlich und die Konzepte sind in gewissem Sinne ziemlich tief. Wenn Sie in die Philosophie der Wahrscheinlichkeit eintauchen möchten, ist Savages 1954 erschienenes Buch Foundation of Statistics ein Klassiker. Google für Bayesian vs. Frequentist und jede Menge Sachen werden auftauchen.
Eine andere Möglichkeit, über IID-Zeichnungen nachzudenken, ist der Satz von de Finetti und der Begriff der Austauschbarkeit . In einem Bayes'schen Rahmen entspricht die Austauschbarkeit der Unabhängigkeit, die von einer latenten Zufallsvariablen (in diesem Fall der Einseitigkeit der Münze) abhängig ist.