Ich habe die Stan-Dokumentation durchgesehen, die hier heruntergeladen werden kann . Besonders interessiert hat mich die Implementierung der Gelman-Rubin-Diagnostik. Das Originalpapier Gelman & Rubin (1992) definiert den potenziellen Skalenreduktionsfaktor (PSRF) wie folgt:
Sei die te Markov-Kette, und es seien insgesamt unabhängige Ketten abgetastet. Sei der Mittelwert aus der ten Kette und der Gesamtmittelwert. Definiere, wobei Und definiere i M ˉ X i ⋅ i ˉ X ⋅ ⋅ W = 1s 2 m =1
Definiere Die PSRF wird mit geschätzt, wobei \ hat {R} = \ dfrac {\ hat {V}} {W} \ cdot \ dfrac {df + 3} {df + 1} \ ,, wobei df = 2 \ hat {V} / Var (\ hat {V}) .√
In der Stan-Dokumentation auf Seite 349 wird der Term mit df ignoriert und der multiplikative Term . Das ist ihre Formel,
Der Varianzschätzer ist
Schließlich wird die Statistik zur möglichen Größenreduzierung durch
Soweit ich weiß, geben sie keinen Hinweis auf diese Änderung der Formel und diskutieren sie auch nicht. Normalerweise ist nicht zu groß und kann oft so niedrig wie , so dass nicht ignoriert werden sollte, auch wenn der Term mit 1 angenähert werden kann.
Woher kommt diese Formel?
EDIT: Ich habe eine teilweise Antwort auf die Frage " Woher kommt diese Formel? " Gefunden , in der das Bayesian Data Analysis-Buch von Gelman, Carlin, Stern und Rubin (zweite Ausgabe) genau dieselbe Formel hat. Das Buch erklärt jedoch nicht, wie / warum es gerechtfertigt ist, diese Ausdrücke zu ignorieren?