Aktualisieren eines Bayes-Faktors


9

Ein Bayes-Faktor wird beim Bayes'schen Testen der Hypothese und der Bayes'schen Modellauswahl durch das Verhältnis zweier Grenzwahrscheinlichkeiten definiert: bei gegebener iid-Stichprobe und entsprechenden Abtastdichten und mit den entsprechenden Prioritäten und ist der Bayes-Faktor für den Vergleich der beiden Modelle Ein Buch, das ich gerade rezensiere, hat die seltsame Aussage, dass der oben genannte Bayes-Faktor(x1,,xn)f1(x|θ)f2(x|η)π1π2

B12(x1,,xn)=defm1(x1,,xn)m2(x1,,xn)=defi=1nf1(xi|θ)π1(dθ)i=1nf2(xi|η)π2(dη)
B12(x1,,xn) wird "durch Multiplikation der einzelnen [Bayes-Faktoren] gebildet" (S.118). Dies ist formal korrekt, wenn man die Zerlegung aber ich sehe in dieser Zerlegung keinen Rechenvorteil als das Update durch erfordert den gleichen Rechenaufwand wie die ursprüngliche Berechnung von
B12(x1,,xn)=m1(x1,,xn)m2(x1,,xn)=m1(xn|x1,,xn1)m2(xn|x1,,xn1)×m1(xn1|xn2,,x1)m2(xn1|xn2,,x1)××m1(x1)m2(x1)
m1(xn|x1,,xn1)m2(xn|x1,,xn1)
m1(x1,,xn)m2(x1,,xn)
außerhalb künstliche Spielzeugbeispiele.

Frage: Gibt es eine generische und rechnerisch effiziente Möglichkeit, den Bayes-Faktor von auf zu aktualisieren , bei dem nicht die gesamten Ränder und berechnet werden müssen ?B12(x1,,xn)B12(x1,,xn+1)m1(x1,,xn)m2(x1,,xn)

Meine Intuition ist, dass es neben Partikelfiltern, die tatsächlich die Bayes-Faktoren eine neue Beobachtung schätzen , keine natürliche Möglichkeit gibt, diese Frage zu beantworten .B12(x1,,xn)


1
Es scheint mir nicht klar zu sein, dass der Wortlaut notwendigerweise eine sequentielle Faktorisierung impliziert , da die Beobachtungen iid sind. Während grad Schule, erwähnte ein Professor , dass das Produkt bedeutet , dass man könnte asymptotische Annäherungen verwendet für Bayes - Analysen aber seltsamerweise war dies nicht auf (Sarkasmus) gefangen. Vielleicht könnte das Buch darauf hindeuten?
Cliff AB

@CliffAB: Ja, Sie könnten die Wahrscheinlichkeit als Durchschnitt einzelner Begriffe umschreiben und zu einer Kullback-Leibler-Entfernung von der tatsächlichen Verteilung konvergieren. Ich glaube jedoch nicht, dass dies der Fall ist, obwohl das Buch unklar genug ist, um alle Optionen offen zu halten.
Xi'an

1
Ich glaube, es gibt einen Tippfehler in der zweiten angezeigten Gleichung: Sollte es im zweiten Faktor in der zweiten Zeile sein? m1(xn1|xn1,,x1)
Jochen

Antworten:


4

Vermutlich besteht der Zweck einer rekursiven Gleichung für den Bayes-Faktor darin, dass Sie den Bayes-Faktor bereits für Datenpunkte berechnet haben und diesen mit einem zusätzlichen Datenpunkt aktualisieren möchten. Es scheint möglich zu sein, dies zu tun, ohne die Ränder des vorherigen Datenvektors neu zu berechnen, solange die Form der posterioren Funktion bekannt ist. Angenommen, wir kennen die Form dieser Funktion (und nehmen IID-Daten wie in Ihrer Frage an), kann die Vorhersagedichte wie folgt geschrieben werden:nπn

m(xn+1|x1,...,xn)=Θf(xn+1|θ)πn(dθ|x1,...,xn).

Daher haben Sie:

m(x1,...,xn+1)=m(x1,...,xn)Θf(xn+1|θ)πn(dθ|x1,...,xn).

Wenn wir zwei Modellklassen über den Bayes-Faktor vergleichen, erhalten wir die rekursive Gleichung:

B12(x1,...,xn+1)=B12(x1,...,xn)Θ1f(xn+1|θ)π1,n(dθ|x1,...,xn)Θ2f(xn+1|θ)π2,n(dθ|x1,...,xn).

Dies beinhaltet immer noch die Integration über den Parameterbereich, daher stimme ich Ihrer Ansicht zu, dass es keinen Rechenvorteil zu geben scheint, wenn nur der Bayes-Faktor über die von Ihnen angegebene Anfangsformel neu berechnet wird. Sie können jedoch sehen, dass Sie hierfür die Ränder für den vorherigen Datenvektor nicht neu berechnen müssen. (Stattdessen berechnen wir die Vorhersagedichten des neuen Datenpunkts unter der Bedingung vorheriger Daten unter jeder der Modellklassen.) Wie Sie sehe ich keinen rechnerischen Vorteil davon, es sei denn, diese Integralformel vereinfacht sich leicht. Ich nehme an, es gibt Ihnen auf jeden Fall eine andere Formel zum Aktualisieren des Bayes-Faktors.


Vielen Dank. Es ist wahr, dass die Marginals nicht streng sensu neu berechnet werden müssen , aber der Rechenaufwand scheint der gleiche zu sein, wie Sie bemerken.
Xi'an

Der einzige Vorteil, den ich mir vorstellen kann, ist, dass der Integrand weniger flüchtig ist, da wir jetzt nur über eine einzelne Dichte (und nicht über das Produkt von Dichten) integrieren. Daher könnte diese letztere Formel es einfacher machen, Unterlaufprobleme in zu vermeiden Berechnung. Das ist vielleicht alles eine große Sache. n
Ben - Reinstate Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.