Ein Ansatz zum Modellvergleich in einem Bayes'schen Rahmen verwendet eine Bernoulli-Indikatorvariable, um zu bestimmen, welches von zwei Modellen wahrscheinlich das "wahre Modell" ist. Bei der Anwendung von MCMC-basierten Werkzeugen zum Anpassen eines solchen Modells werden häufig Pseudo-Priors verwendet, um das Mischen in den Ketten zu verbessern. Sehen Sie hier für eine sehr zugängliche Behandlung von warum pseudo-priors nützlich sind.
In ihrer wegweisenden Arbeit zu diesem Thema stellen Carlin & Chib (S. 475) fest, dass "die Form von [dem Pseudo-Prior] irrelevant ist", was ich damit meine, dass sie die posteriore Inferenz basierend auf dem Modell nicht beeinflussen sollte (obwohl Dies kann die MCMC-Mischung während der Modellanpassung beeinflussen. Meine Vermutung ist jedoch, dass die Form des Pseudo-Prior DOES eine Rolle spielt. Ich habe dies zuvor in dieser Frage gefragt . @ Xi'an kommentierte (4. Kommentar): "Die Schlussfolgerung, welches Modell korrekt ist, hängt nicht von den Pseudo-Priors ab ".
Kürzlich habe ich Kommentare von Martyn Plummer gelesen , die meinem Verständnis von Carlin & Chib widersprechen. Martyn sagt: " Damit die Carlin-Chib-Methode funktioniert, muss der Pseudo-Prior mit dem Posterior übereinstimmen, wenn das Modell wahr ist. "
(Ich sage NICHT, dass Plummer Carlin & Chib widerspricht; nur, dass er meinem Verständnis von Carlin & Chibs Behauptung widerspricht ).
All dies lässt mich mit fünf Fragen zurück:
- Was geht hier vor sich? Vorausgesetzt, dass das Modell konvergiert und eine gute effektive Stichprobengröße vom posterioren ergibt, hängt meine Schlussfolgerung darüber, welche Variablen in ein Modell aufgenommen werden sollen, von meinem Pseudo-Prior ab?
- Wenn nicht, wie können wir dies mit meiner Intuition und Plummers Kommentar in Einklang bringen ? Wenn ja, wie können wir dies mit Carlin & Chibs Papier und Xi'ans Kommentar (4. Kommentar) in Einklang bringen ?
- Wenn mein Verständnis von Plummers Kommentar korrekt ist und die Pseudo-Priors dem Posterior entsprechen müssen, wenn die Variable enthalten ist ... bedeutet dies, dass es für Pseudo-Priors unzulässig ist, genau den wahren Priors zu entsprechen? Dies würde bedeuten, dass Pseudo-Priors viel mehr als eine bequeme Technik sind, um das Mischen in der MCMC zu verbessern !!
Was ist, wenn die Indikatorvariable einen Teil des Modells mit mehreren Parametern ein- und ausschaltet (z. B. einen zufälligen Effekt mit einem großen Mittelwert, einer Varianz und n Gruppeneffekten)? Welche der folgenden Punkte sind zulässig (in der Reihenfolge, in der ich sicher bin, dass der Ansatz zulässig ist)? Gibt es einen besseren Ansatz, den ich nicht aufführe?
ich. Verwenden Sie einen Pseudo-Prior, der die vollständige Verteilung aller Parameter im hinteren Bereich des Gelenks annähert.
ii. Wenn das Mischen akzeptabel nicht grausam ist, verwenden Sie überhaupt keine Pseudo-Priors (dh verwenden Sie Pseudo-Priors, die den wahren Priors entsprechen).
iii. Verwenden Sie für jeden Parameter einen Pseudo-Prior, der auf den univariaten posterioren Verteilungen basiert, aber machen Sie sich keine Sorgen darüber, wie sie gemeinsam verteilt sind.
iv. Verwenden Sie nach der scheinbar einfachen Sprache von Carlin & Chib einen Pseudo-Prior, der ein rechnerisch effizientes Mischen in den MCMC-Ketten ermöglicht, da "die Form des [Pseudo-Prior] irrelevant ist".
Was bedeutet @ Xi'an im ersten Kommentar zu meiner Frage : " Die Pseudo-Priors müssen in einer wichtigen Stichprobenart korrigiert werden. "