Dies ist eine wiederkehrende Frage (siehe diesen Beitrag , diesen Beitrag und diesen Beitrag ), aber ich habe einen anderen Dreh.
Angenommen, ich habe ein paar Samples von einem generischen MCMC-Sampler. Für jede Probe , weiß ich den Wert der Log - Likelihood und des log vor . Wenn es hilft, kenne ich auch den Wert der Log-Wahrscheinlichkeit pro Datenpunkt, (diese Information hilft bei bestimmten Methoden, wie WAIC und PSIS-LOO).
Ich möchte eine (grobe) Schätzung der Grenzwahrscheinlichkeit erhalten, nur mit den Stichproben, die ich habe, und möglicherweise ein paar anderen Funktionsbewertungen (aber ohne ein Ad-hoc- MCMC erneut auszuführen ).
Lassen Sie uns zuerst den Tisch abräumen. Wir alle wissen, dass der harmonische Schätzer der schlechteste Schätzer aller Zeiten ist . Lass uns weitermachen. Wenn Sie Gibbs-Sampling mit Priors und Posteriors in geschlossener Form durchführen, können Sie die Chib-Methode verwenden . Ich bin mir jedoch nicht sicher, wie ich außerhalb dieser Fälle verallgemeinern soll. Es gibt auch Methoden, bei denen Sie das Probenahmeverfahren ändern müssen (z. B. über temperierte Seitenzähne ), aber das interessiert mich hier nicht.
Der Ansatz, an den ich denke, besteht darin, die zugrunde liegende Verteilung mit einer parametrischen (oder nichtparametrischen) Form ) zu approximieren und dann die Normalisierungskonstante als ein 1-D-Optimierungsproblem (dh das , das einen Fehler minimiert herauszufinden zwischen und , bewertet an den Abtastwerten). Nehmen wir im einfachsten Fall an, der posterior ist ungefähr multivariate Normalen, ich kann als multivariate Normalen anpassen und etwas Ähnliches wie eine Laplace-Näherung erhalten (ich möchte möglicherweise ein paar zusätzliche Funktionsauswertungen verwenden, um die Position von zu verfeinern der Modus). Ich könnte jedoch alseine flexiblere Familie wie eine Variationsmischung multivariater Verteilungen.
Ich schätze, dass diese Methode nur funktioniert, wenn eine vernünftige Annäherung an , aber jeder Grund oder jede warnende Geschichte, warum dies sehr unklug wäre TU es? Eine Lektüre, die Sie empfehlen würden?
Der vollständig nichtparametrische Ansatz verwendet eine nichtparametrische Familie, wie einen Gaußschen Prozess (GP), um (oder eine andere nichtlineare Transformation davon, wie z als Quadratwurzel) und Bayes'sche Quadratur zur impliziten Integration über das zugrunde liegende Ziel (siehe hier und hier ). Dies scheint ein interessanter alternativer Ansatz zu sein, der jedoch sinngemäß analog ist (beachten Sie auch, dass Allgemeinmediziner in meinem Fall unhandlich wären).