Warum haben Personen mit geringer Fitness eine Chance, bis zur nächsten Generation zu überleben?


24

Ich lese und beobachte gerade genetische Algorithmen und finde sie sehr interessant (ich hatte während meines Studiums keine Gelegenheit, sie zu studieren).

Ich verstehe, dass Mutationen auf Wahrscheinlichkeit basieren (Zufälligkeit ist die Wurzel der Evolution), aber ich verstehe nicht, warum das Überleben so ist.

Von dem, was ich verstehe, ein Individuum Fitness mit wie für eine andere Person Fitness mit haben wir , dann eine bessere Wahrscheinlichkeit als , um zu überleben zur nächsten Generation.F ( i ) J F ( j ) F ( i ) > F ( j ) I JIF(i)JF(j)F(i)>F(j)IJ

Wahrscheinlichkeit bedeutet , dass kann überleben und kann nicht (mit „Pech“). Ich verstehe nicht, warum das überhaupt gut ist? Wenn die Auswahl immer überleben würde , was würde im Algorithmus schief gehen? Ich vermute, dass der Algorithmus einem gierigen Algorithmus ähnelt, bin mir aber nicht sicher.ichJ I I


13
Sich auf ein lokales Minimum beschränken.
Louis

Selbst im wirklichen Leben garantieren vorteilhafte Mutationen nicht das Überleben von Individuen, was tatsächlich eine größere Vielfalt von Merkmalen ermöglicht (und möglicherweise von Vorteil sein kann, wenn sich die Umgebung unerwartet ändert). obwohl das für einen Optimierungsalgorithmus nicht so wahrscheinlich ist). ... Und das steht ganz am Ende von Nicks Antwort.
JAB

1
Wenn du die Schwachen die ganze Zeit tötest, was hast du dann außer einem einfachen Bergsteiger?
Raphael

Antworten:


35

Die Hauptidee ist, dass Sie durch Überlebenlassen suboptimaler Individuen durch eine Abfolge kleiner inkrementeller Mutationen von einem "Höhepunkt" in der Evolutionslandschaft zu einem anderen wechseln können. Wenn Sie jedoch nur bergauf gehen dürfen, ist eine gigantische und äußerst unwahrscheinliche Mutation erforderlich, um die Spitzen zu wechseln.

Hier ist ein Diagramm, das den Unterschied zeigt:

Bildbeschreibung hier eingeben

Praktisch ist diese Globalisierungseigenschaft der Hauptverkaufspunkt evolutionärer Algorithmen - wenn Sie nur ein lokales Maximum finden möchten, gibt es effizientere Spezialtechniken. (zB L-BFGS mit endlichem Differenzgradienten und Liniensuche)

In der realen Welt der biologischen Evolution schafft das Überleben suboptimaler Individuen Robustheit, wenn sich die Evolutionslandschaft ändert. Wenn sich alle auf einen Gipfel konzentrieren, stirbt die gesamte Bevölkerung, wenn dieser Gipfel zu einem Tal wird (z. B. waren Dinosaurier die am besten geeigneten Arten, bis ein Asteroidenschlag stattfand und sich die Entwicklungslandschaft veränderte). Auf der anderen Seite, wenn es eine gewisse Vielfalt in der Bevölkerung gibt, werden einige überleben, wenn sich die Landschaft ändert.


2
"In der realen Welt der biologischen Evolution schafft es Robustheit, wenn suboptimale Individuen überleben können, wenn sich die Evolutionslandschaft ändert" - ein Biologe, der dies in den Schatten stellt. Personen mit geringer Fitness dürfen nicht "überleben", um die Fitness zu maximieren, die der Natur der Realität entspricht. Organismen mit geringer Fitness versuchen so viel wie alles andere zu überleben.
Jack Aidley

Natürlich hast du recht, die Natur entscheidet sich nicht dafür, etwas zuzulassen oder zu verbieten, es passiert einfach. Andererseits gibt es viele Beispiele, in denen Menschen Pflanzen und Tiere selektiv so züchten, dass sie nur das "Beste" halten. Dadurch entsteht eine Monokultur, die nicht robust ist, wenn eine neue Krankheit auftritt oder sich die Umwelt verändert.
Nick Alger

Es gibt andere Techniken, um diesen Effekt zu bekämpfen, z. B. größere Schritte und das erneute Ausführen mit zufälligen Anfangspopulationen. Bei Crossover-Rekombination kann es außerdem hilfreich sein, einen schwächeren Genotyp beizubehalten, wenn ein stärkerer mutiert und ein Crossover zwischen den beiden noch stärker ausfällt.
Raphael

13

Die Antwort von Nick Alger ist sehr gut, aber ich werde sie mit einer Beispielmethode, der Metropolis-Hastings-Methode, etwas mathematischer gestalten.

Das Szenario, das ich untersuchen werde, ist, dass Sie eine Bevölkerung von einem haben. Sie schlagen eine Mutation vom Zustand zum Zustand mit der Wahrscheinlichkeit , und wir unterstellen auch die Bedingung, dass . Wir werden auch annehmen, dass für alle ; Wenn Ihr Modell keine Fitness aufweist, können Sie dies beheben, indem Sie überall ein kleines Epsilon hinzufügen.j Q ( i , j ) Q ( i , j ) = Q ( j , i ) F ( i ) > 0 iijQ(i,j)Q(i,j)=Q(j,i)F(i)>0i

Wir akzeptieren einen Übergang von nach mit der Wahrscheinlichkeit:jij

min(1,F(j)F(i))

Mit anderen Worten, wenn mehr passt, nehmen wir es immer, aber wenn weniger passt, nehmen wir es mit der Wahrscheinlichkeit , andernfalls versuchen wir es erneut, bis wir a akzeptieren Mutation.jjF(j)F(i)

Nun wollen wir , die tatsächliche Wahrscheinlichkeit, mit der wir von nach übergehen .P(i,j)ij

Klar ist es:

P(i,j)=Q(i,j)min(1,F(j)F(i))

Nehmen wir an, dass . Dann = 1 und so:F(j)F(i)min(1,F(j)F(i))

F(i)P(i,j)
=F(i)Q(i,j)min(1,F(j)F(i))
=F(i)Q(i,j)
=Q(j,i)min(1,F(i)F(j))F(j)
=F(j)P(j,i)

Wenn Sie das Argument rückwärts ausführen und auch den trivialen Fall mit , können Sie Folgendes für alle und :i=jij

F(i)P(i,j)=F(j)P(j,i)

Dies ist aus einigen Gründen bemerkenswert.

Die Übergangswahrscheinlichkeit ist unabhängig von . Natürlich kann es eine Weile dauern, bis wir im Attraktor landen, und es kann eine Weile dauern, bis wir eine Mutation akzeptieren. Sobald wir dies tun, ist die Übergangswahrscheinlichkeit vollständig von und nicht von abhängig .QFQ

Zusammenfassend gebe :i

iF(i)P(i,j)=iF(j)P(j,i)

Es ist klar, dass auf summieren muss, wenn Sie über alles summieren (dh, die Übergangswahrscheinlichkeiten aus einem Zustand müssen auf summieren ), sodass Sie Folgendes erhalten:P(j,i)1i1

F(j)=iF(i)P(i,j)

Das heißt, ist die (nicht normalisierte) Wahrscheinlichkeitsdichtefunktion, für die die Methode Zustände auswählt. Sie werden nicht nur garantiert die ganze Landschaft erkunden, Sie tun dies auch proportional dazu, wie "fit" jeder Staat ist.F

Dies ist natürlich nur ein Beispiel von vielen. Wie ich weiter unten bemerkte, handelt es sich um eine Methode, die sehr einfach zu erklären ist. In der Regel verwenden Sie eine GA nicht, um ein PDF zu durchsuchen, sondern um ein Extrem zu finden. In diesem Fall können Sie einige Bedingungen lockern und dennoch mit hoher Wahrscheinlichkeit eine eventuelle Konvergenz gewährleisten.


Wunderbare Antwort! Ich wünschte, ich könnte es wiederholt stimmen. Eine Frage: Können Sie begründen, warum wir wählen würden ? Wird das gewählt, weil dann der ganze Rest der Mathematik ein sehr geschicktes Ergebnis liefert? Oder gibt es einen externen Grund, warum dies eine natürliche Wahl für ? (Ich hätte erwartet, dass ein natürlicher Wert für einer über der Anzahl der Außenkanten von Zustand ist. In diesem Fall hätten wir nicht da im Allgemeinen die Abweichung von und unterschiedlich sein kann.)Q(i,j)=Q(j,i)QQ(i,j)iQ(i,j)=Q(j,i)ij
DW

Die Motivation in diesem Fall ist die detaillierte Gleichgewichtsbedingung , die eine ausreichende (wenn auch nicht notwendige) Bedingung ist, um sicherzustellen, dass der stationäre Zustand ist pdf. Wenn Sie möchten, dass Ihre PDF-Datei stationär ist, ist es hilfreich, wenn der Prozess in gewisser Weise zeitlich umkehrbar ist. Wenn es hilft, wurde der MH-Algorithmus auch für kontinuierliche Probleme (Neutronentransport) entwickelt, bei denen es keine diskrete Anzahl von Außenkanten gibt. Wenn Sie versuchen, ein globales Maximum zu finden, ist das Durchsuchen der gesamten PDF-Datei natürlich nicht immer das, was Sie wirklich wollen. Dies war nur zu Illustrationszwecken. FF(i)P(i,j)=F(j)P(j,i)F
Pseudonym

7

Der Vorteil einer GA besteht darin, dass Sie breitere Suchbereiche erkunden können, indem Sie Pfaden folgen, die von potenziell schlechteren Kandidaten stammen. Es sollte schlechtere Kandidaten geben, die es schaffen, diese verschiedenen Bereiche der Suche zu erkunden, nicht viele, aber definitiv einige. Wenn Sie bei jedem Entfernen dieses Erkundungsaspekts des Algorithmus nur das Allerbeste nehmen, wird er eher zu einem Bergsteiger. Auch die konstante Auswahl der besten kann zu einer vorzeitigen Konvergenz führen.


6

Tatsächlich verfolgen Auswahlalgorithmen beide Ansätze. Ein Weg ist, was Sie vorgeschlagen haben, und der andere ist, dass Personen mit höherer Fitness ausgewählt werden und solche mit niedrigerer Fitness nicht.

Der Ansatz, den Sie zur Auswahl auswählen, ist auch auf das Problem zugeschnitten, das Sie modellieren möchten. In einem Experiment in der Schule versuchten wir, Kartenspieler zu entwickeln, indem wir sie gegeneinander spielen ließen (dh Turnierauswahl ). In einem solchen Szenario könnten wir einfach immer gegenüber favorisieren (aus Ihrem Beispiel), da der Aspekt „Glück“ bereits im Spiel selbst enthalten ist. Selbst wenn für zwei beliebige und in einer bestimmten Runde wäre, hätte die Runde gewinnen können und wir könntenIJF(i)>F(j)IJJF(j)>F(i). Denken Sie daran, dass eine Bevölkerung oft groß genug ist, um einige gute Individuen zu verlieren, und im Großen und Ganzen wird es nicht so wichtig sein.

Da GAs anhand der realen Evolution modelliert werden, werden sie bei der Verwendung probabilistischer Verteilungen hauptsächlich danach modelliert, wie sich reale Gemeinschaften entwickeln, in denen manchmal Personen mit geringerer Fitness überleben können, während Personen mit höherer Fitness dies möglicherweise nicht tun (eine grobe Analogie: Autounfälle, natürlich) Katastrophen etc. :-)).


0

Es ist ganz einfach: Manchmal können "Kind" -Lösungen mit höherer Fitness aus "Eltern" -Lösungen mit niedrigerer Fitness durch Überkreuzen oder Mutation entstehen (das ist eigentlich ein Großteil der Theorie genetischer Algorithmen). Im Allgemeinen möchte man die Lösungen mit höherer Fitness suchen / tragen, aber eine zu große Betonung auf das Halten / Züchten von Lösungen mit hoher Fitness kann dazu führen, dass die lokalen Minima nicht eingehalten werden und die große "evolutionäre Landschaft" nicht durchsucht wird. Tatsächlich kann man den "Cutoff für höhere Fitness" für das Überleben so streng oder lasch machen, wie man es wünscht und experimentieren, wie er die Qualität der endgültigen Lösung beeinflusst. Sowohl zu strenge als auch zu lockere Abschneidestrategien führen zu minderwertigen Endlösungen. Natürlich hat all dies eine gewisse Beziehung zur realen biologischen Evolution. es ist mehr "

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.