Die Antwort von Nick Alger ist sehr gut, aber ich werde sie mit einer Beispielmethode, der Metropolis-Hastings-Methode, etwas mathematischer gestalten.
Das Szenario, das ich untersuchen werde, ist, dass Sie eine Bevölkerung von einem haben. Sie schlagen eine Mutation vom Zustand zum Zustand mit der Wahrscheinlichkeit , und wir unterstellen auch die Bedingung, dass . Wir werden auch annehmen, dass für alle ; Wenn Ihr Modell keine Fitness aufweist, können Sie dies beheben, indem Sie überall ein kleines Epsilon hinzufügen.j Q ( i , j ) Q ( i , j ) = Q ( j , i ) F ( i ) > 0 iichjQ ( i , j )Q ( i , j ) = Q ( j , i )F( i ) > 0ich
Wir akzeptieren einen Übergang von nach mit der Wahrscheinlichkeit:jichj
min(1,F(j)F(i))
Mit anderen Worten, wenn mehr passt, nehmen wir es immer, aber wenn weniger passt, nehmen wir es mit der Wahrscheinlichkeit , andernfalls versuchen wir es erneut, bis wir a akzeptieren Mutation.jjF(j)F(i)
Nun wollen wir , die tatsächliche Wahrscheinlichkeit, mit der wir von nach übergehen .P(i,j)ij
Klar ist es:
P(i,j)=Q(i,j)min(1,F(j)F(i))
Nehmen wir an, dass . Dann = 1 und so:F(j)≥F(i)min(1,F(j)F(i))
F(i)P(i,j)
=F(i)Q(i,j)min(1,F(j)F(i))
=F(i)Q(i,j)
=Q(j,i)min(1,F(i)F(j))F(j)
=F(j)P(j,i)
Wenn Sie das Argument rückwärts ausführen und auch den trivialen Fall mit , können Sie Folgendes für alle und :i=jij
F(i)P(i,j)=F(j)P(j,i)
Dies ist aus einigen Gründen bemerkenswert.
Die Übergangswahrscheinlichkeit ist unabhängig von . Natürlich kann es eine Weile dauern, bis wir im Attraktor landen, und es kann eine Weile dauern, bis wir eine Mutation akzeptieren. Sobald wir dies tun, ist die Übergangswahrscheinlichkeit vollständig von und nicht von abhängig .QFQ
Zusammenfassend gebe :i
∑iF(i)P(i,j)=∑iF(j)P(j,i)
Es ist klar, dass auf summieren muss, wenn Sie über alles summieren (dh, die Übergangswahrscheinlichkeiten aus einem Zustand müssen auf summieren ), sodass Sie Folgendes erhalten:P(j,i)1i1
F(j)=∑iF(i)P(i,j)
Das heißt, ist die (nicht normalisierte) Wahrscheinlichkeitsdichtefunktion, für die die Methode Zustände auswählt. Sie werden nicht nur garantiert die ganze Landschaft erkunden, Sie tun dies auch proportional dazu, wie "fit" jeder Staat ist.F
Dies ist natürlich nur ein Beispiel von vielen. Wie ich weiter unten bemerkte, handelt es sich um eine Methode, die sehr einfach zu erklären ist. In der Regel verwenden Sie eine GA nicht, um ein PDF zu durchsuchen, sondern um ein Extrem zu finden. In diesem Fall können Sie einige Bedingungen lockern und dennoch mit hoher Wahrscheinlichkeit eine eventuelle Konvergenz gewährleisten.