Ich nehme an einem Kurs über Monte-Carlo-Methoden teil und wir haben in der letzten Vorlesung die Rejection Sampling-Methode (oder Accept-Reject Sampling-Methode) gelernt. Es gibt viele Ressourcen im Web, die den Beweis dieser Methode zeigen, aber irgendwie bin ich nicht davon überzeugt.
In der Ablehnungsabtastung haben wir also eine Verteilung der schwer abzutasten ist. Wir wählen eine einfach zu beprobende Verteilung und finden einen Koeffizienten so dass . Dann probieren wir aus und für jede Ziehung auch ein aus einer Standardgleichverteilung .
Das Beispiel wird akzeptiert, wenn es und andernfalls abgelehnt.
Die Beweise, auf die ich gestoßen bin, zeigen normalerweise nur, dass und hören dort auf.
Was ich über diesen Prozess denke, ist, dass wir eine Folge von Variablen und ein Paar haben, das unserer i-ten Stichprobe ( ) entspricht und ob es akzeptiert wird ( ). Wir wissen, dass jedes Paar unabhängig voneinander ist, so dass:
Für ein Paar wissen wir, dass und P (Accept_i | x_i) = \ frac {f (x_i)} {cg (x_i)} . Wir können p (x_i | Accept_i) leicht berechnen, aber ich verstehe nicht, wie es als Beweis ausreicht. Wir müssen zeigen, dass der Algorithmus funktioniert, daher denke ich, dass ein Beweis zeigen sollte, dass die offizielle Verteilung der akzeptierten Stichproben gegen f (x) als n \ rightarrow \ infty konvergiert . Ich meine, wobei n die Anzahl aller akzeptierten und abgelehnten Proben ist:P ( x i ) = g ( x i ) P ( A c c e p t i | x i ) = f ( x i ) p(xi|Accepti)f(x)n→∞n
n→∞ als .
Bin ich falsch mit diesem Gedankenmuster? Oder gibt es einen Zusammenhang zwischen dem gemeinsamen Beweis des Algorithmus und diesem?
Danke im Voraus