Sowohl (1) als auch (1b) sind korrekt. Das OP hat Recht, dass (in diesem Modell) bei möglicherweise ein Änderungspunkt vorhanden ist und davon abhängt, ob es einen Änderungspunkt gibt. Dies impliziert keine Probleme mit (1), da die möglichen Werte von vollständig von "abgedeckt" werden . bedeutet die bedingte Verteilung von bedingt durch . Diese bedingte Verteilung wird über "alles andere" einschließlich , abhängig von . So wie man beispielsweise schreiben könntet+1xt+1rt+1P(xt+1∣rt,x1:t)P(xt+1|rt,x1:t)xt+1(rt,x1:t)rt+1(rt,x1:t)P(xt+1000|xt)Dies würde alle möglichen Konfigurationen von Änderungspunkten sowie Werte von s berücksichtigen, die zwischen und .xitt+1000
Im Rest leite ich zuerst (1) und dann (1b) basierend auf (1) ab.
Herleitung von (1)
Für alle Zufallsvariablen gilt:
solange diskret ist (andernfalls muss die Summe durch ein Integral ersetzt werden). Anwenden auf :A,B,C
P(A∣B)=∑cP(A∣B,C=c)P(C=c∣B),
Cxt+1,x1:t,rt
P(xt+1∣x1:t)=∑rtP(xt+1∣rt,x1:t)P(rt∣x1:t),
die unabhängig von den Abhängigkeiten zwischen , , gilt, keine Modellannahmen haben verwendet wurde. In dem vorliegenden Modell wird angenommen, dass gegebenem * bedingt unabhängig von den Werten von aus den Läufen vor . Dies impliziert . Wenn wir dies in die vorherige Gleichung einsetzen, erhalten wir
rtx1:txt+1xt+1rt,x(r)txx(r)tP(xt+1∣rt,x1:t)=P(xt+1∣rt,x(r)t)
P(xt+1∣x1:t)=∑rtP(xt+1∣rt,x(r)t)P(rt∣x1:t),(1)
die (1) in OP ist.
Ableitung von (1b)
Betrachten wir die Zerlegung von über mögliche Werte von :
P(xt+1∣rt,x(r)t)rt+1
P(xt+1∣rt,x(r)t)=∑rt+1P(xt+1∣rt+1,rt,x(r)t)P(rt+1∣rt,x(r)t).
Da angenommen wird, dass * ob ein Änderungspunkt bei (zwischen und ) auftritt, nicht von der Geschichte von abhängt , haben wir . Da bestimmt, ob zum selben Lauf wie , haben wir außerdem . Wenn wir diese beiden Vereinfachungen in die obige Faktorisierung einsetzen, erhalten wir
t+1xtxt+1xP(rt+1∣rt,x(r)t)=P(rt+1∣rt)rt+1xt+1xtP(xt+1∣rt+1,rt,x(r)t)=P(xt+1∣rt+1,x(r)t)
P(xt+1∣rt,x(r)t)=∑rt+1P(xt+1∣rt+1,x(r)t)P(rt+1∣rt).
Wenn wir dies in (1) einsetzen, erhalten wir
die OPs (1b) ist.
P(xt+1∣x1:t)=∑rt(∑rt+1P(xt+1∣rt+1,x(r)t)P(rt+1∣rt))P(rt∣x1:t),(1b)
* Bemerkung zu den bedingten Unabhängigkeitsannahmen des Modells
Basierend auf dem schnellen Durchsuchen des Papiers möchte ich persönlich, dass die Eigenschaften der bedingten Unabhängigkeit irgendwo expliziter angegeben werden, aber ich nehme an, dass die Absicht ist, dass Markovian ist und die : s, die verschiedenen Läufen zugeordnet sind, unabhängig sind (angesichts der Läufe).rx