Ich würde das Buch Bayesian Data Analysis als eine großartige Quelle für die Beantwortung dieser Frage (insbesondere Kapitel 6) und für alles, was ich zu sagen habe, vorschlagen . Eine der üblichen Methoden, mit denen Bayesianer dieses Problem angreifen, ist die Verwendung von posterioren prädiktiven P-Werten (PPPs). Bevor ich erläutere, wie PPPs dieses Problem lösen könnten, möchte ich zunächst die folgende Notation definieren:
Sei die beobachteten Daten undy der Vektor von Parametern. Wir definieren y rep als dierepliziertenDaten,diebeobachtet worden seinkönnten, oder vorausschauend als die Daten, die wirmorgen sehenwürden,wenn das Experiment, das y heuteerzeugte, mit demselben Modell und demselben Wert von θ repliziert würde, das das beobachtete erzeugte Daten.θyrepyθ
Anmerkung werden wir die Verteilung von definieren angesichts der aktuellen Wissensstand mit dem posterioren prädiktiven Verteilung
p ( y rep | y ) = ∫ & THgr; p ( y rep | θ ) p ( θ | y ) d θyrep
p(yrep|y)=∫Θp(yrep|θ)p(θ|y)dθ
Jetzt können wir die Diskrepanz zwischen dem Modell messen und die Daten durch die Definition von Testmengen , die Aspekte der Daten , die wir überprüfen möchten. Eine Testmenge oder Diskrepanz Maßnahme , , eine skalare Zusammenfassung von Parametern und Daten , die als Standard verwendet wird , wenn Daten in prädiktive Simulationen verglichen wird . Testgrößen spielen bei der Bayes'schen Modellprüfung die Rolle, die Teststatistiken bei klassischen Tests spielen. Wir definieren die Notation T ( y )T(y,θ)T(y)für eine Teststatistik, bei der es sich um eine Testgröße handelt, die nur von Daten abhängt; Im Bayes'schen Kontext können wir die Teststatistik verallgemeinern, um die Abhängigkeit von den Modellparametern unter ihrer posterioren Verteilung zu ermöglichen.
Classically, der p-Wert für die Teststatistik ist
p C = Pr ( T ( y rep ) ≥ T ( y ) | θ ) ,
wo die Wahrscheinlichkeit über die Verteilung der genommen wird y rep mit θ fixiert.T( y)
pC= Pr ( T( yrep) ≥ T( y) | θ )
yrepθ
Aus einer Bayes'schen Perspektive kann eine fehlende Anpassung der Daten in Bezug auf die posteriore prädiktive Verteilung durch die Schwanzbereichswahrscheinlichkeit oder den p-Wert der Testgröße gemessen und unter Verwendung posteriorer Simulationen von berechnet werden. . Beim Bayes'schen Ansatz können Testgrößen Funktionen der unbekannten Parameter sowie Daten sein, da die Testgröße über Ziehungen aus der posterioren Verteilung der unbekannten Parameter ausgewertet wird.( θ , yrep)
pB= Pr ( T( yrep, θ ) ≥ T( y, θ ) | y)
θyrepp ( θ , yrep| y)pB= ∬ΘichT( yrep, θ ) ≥ T( y| θ)p ( yrep| θ)p(θ | y) dyrepdθ ,
ich
LθyrepθLp ( yrep, θ | y)T( y, θl)T( yrep l, θl)L
T(yrepl,θl)≥T(y,θl)
l=1,...,L
Im Gegensatz zum klassischen Ansatz erfordert die Bayes'sche Modellprüfung keine speziellen Methoden zum Umgang mit "Störparametern". Indem wir posteriore Simulationen verwenden, mitteln wir implizit über alle Parameter im Modell.
Eine weitere Quelle, Andrew Gelman, hat auch einen sehr schönen Artikel über PPPs hier:
http://www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf