Ich denke, es ist richtiger, von der posterioren Verteilung Ihres Parameters zu sprechen, als von seiner posterioren Schätzung. Zur Klarheit der Notationen werde ich im Folgenden die Primzahl in σ ′ 2 fallen lassen .σ′2σ′2
Angenommen, als verteilt N ( 0 , σ 2 ) , - I fallen μ für jetzt ein heuristisches Beispiel zu machen - und 1 / σ 2 = σ - 2 verteilt sich wie Γ ( α , β ) und ist unabhängig von X .XN(0,σ2)μ1/σ2=σ−2Γ(α,β)X
Das PDF von mit σ - 2 ist Gaußsch, dhXσ−2
f(x|σ−2)=12πσ2−−−−√exp(−x22σ2).
(X,σ−2)f(x,σ−2)f(x|σ−2)g(σ−2)σ−2
f(x,σ−2)=12πσ2−−−−√exp(−x22σ2)βαΓ(α)exp(−βσ2)1σ2(α−1).
Wir können ähnliche Begriffe gruppieren und wie folgt umschreiben
f(x,σ−2)∝σ−2(α−1/2)exp(−σ−2(β+x2/2)).
σ−2σ−2xf(x,σ−2)/f(x)f(σ−2|x)f(x,σ−2)Γσ−2f(x)
f(x)∝(β+x2/2)−(α+1/2),
Durch Teilen erhalten wir also
f(σ−2|x)∝(β+x2/2)(σ−2(β+x2/2))α−1/2exp(−σ−2(β+x2/2))∝(σ−2(β+x2/2))α−1/2exp(−σ−2(β+x2/2)).
Γ(α+1/2,β+x2/2)
((x1,σ−21),...,(xn,σ−2n))σ−2if(x1,...,xn)f(σ−21,...,σ−2n|x1,...,xn)
f(σ−21,...,σ−2n|x1,...,xn)∝∏i=1n(σ−2i(β+x2i/2))α−1/2exp(−σ−2i(β+x2i/2)),
Γσ−2iΓ
xiσ−2σ−2Γ(α,β)xiσ−2
f(x1,...,xn,σ−2)∝σ−2(α+n/2)exp(−σ−2(β+12∑i=1nx2i)),
σ−2
σ−2Γαβnσ−2α/βα/β2α=βσ−2weil die Varianz riesig wird. Da die Werte klein sind, können Sie sie aus den obigen Gleichungen entfernen und erhalten Ihre Gleichung 3.
ΓS2σ2
In Bezug auf Ihre Frage 2 können Sie natürlich die in einem früheren Experiment erhaltenen Werte als Ihre Prioritäten verwenden. Da wir oben eine Parallele zwischen Bayes'scher und frequentistischer Interpretation hergestellt haben, können wir näher darauf eingehen und sagen, dass es so ist, als würde man eine Varianz aus einer kleinen Stichprobengröße berechnen und dann mehr Datenpunkte sammeln: Sie würden Ihre Schätzung der Varianz aktualisieren, anstatt sie wegzuwerfen die ersten Datenpunkte.
Zu Ihrer Frage 3. Ich mag die Einführung in die mathematische Statistik von Hogg, McKean und Craig, die normalerweise Einzelheiten zur Ableitung dieser Gleichungen enthält.