Was ist der Unterschied zwischen Suchen und Lernen?

9

Über den YouTube-Kanal von Two Minute Papers stieß ich auf einen Artikel, The Bitter Truth . Rich Sutton sagt ...

Eine Sache, die aus der bitteren Lektion gelernt werden sollte, ist die große Kraft von Allzweckmethoden, von Methoden, die mit zunehmender Berechnung weiter skalieren, selbst wenn die verfügbare Berechnung sehr groß wird. Die beiden Methoden, die auf diese Weise willkürlich zu skalieren scheinen, sind Suchen und Lernen .

Was ist hier der Unterschied zwischen Suchen und Lernen? Mein Verständnis ist, dass Lernen eine Form der Suche ist - bei der wir iterativ nach einer Darstellung von Daten suchen, die eine Verlustfunktion im Kontext des tiefen Lernens minimiert.

deep-learning philosophy search

— nvi
quelle

6

Im Kontext der KI:

Die Suche bezieht sich auf den allgemeinen Problemlöser von Simon & Newell und enthält viele (viele) Nachkommenalgorithmen. Diese Algorithmen haben folgende Form:

ein. Stellen Sie einen aktuellen Zustand eines Teils der Welt als Scheitelpunkt in einem Diagramm dar.

b. Stellen Sie, durch Kanten mit dem aktuellen Zustand verbunden, alle Zustände der Welt dar, die vom aktuellen Zustand aus durch Ändern der Welt mit einer einzigen Aktion erreicht werden können, und stellen Sie alle nachfolgenden Zustände auf dieselbe Weise dar.

c. Finden Sie algorithmisch eine Folge von Aktionen, die von einem aktuellen Zustand zu einem gewünschten Zielzustand führen, indem Sie in diesem Diagramm herumlaufen.

Ein Beispiel für eine Anwendung, die die Suche verwendet, ist Google Maps. Ein weiterer Grund ist Google Flights.

Lernen bezieht sich auf jeden Algorithmus, der einen Glauben an die Welt verfeinert, indem er Erfahrungen oder Beispielen der Erfahrungen anderer ausgesetzt wird. Lernalgorithmen haben keine eindeutigen Eltern, da sie in vielen verschiedenen Teilbereichen oder Disziplinen separat entwickelt wurden. Eine vernünftige Taxonomie ist das 5-Stämme- Modell. Einige Lernalgorithmen verwenden tatsächlich die Suche in sich selbst, um herauszufinden, wie sie ihre Überzeugungen als Reaktion auf neue Erfahrungen ändern können!

Ein Beispiel für einen heute verwendeten Lernalgorithmus ist das Q-Learning , das Teil der allgemeineren Familie von Verstärkungslernalgorithmen ist. Q-Learning funktioniert folgendermaßen:

ein. Das Lernprogramm (normalerweise als Agent bezeichnet ) erhält eine Darstellung des aktuellen Zustands der Welt und eine Liste der Aktionen, die es ausführen kann.

$Q(s,a)$ $a$ $s$

$Q(s,a)$ $\epsilon$

d. Die Aktion des Agenten bewirkt, dass sich die Welt verändert, und kann dazu führen, dass der Agent eine Belohnung von der Umgebung erhält. Der Agent notiert, ob er eine Belohnung erhalten hat (und wie hoch die Belohnung war) und wie der neue Zustand der Welt ist. Anschließend passt es seinen Glauben an die Qualität der Ausführung der Aktion in dem Zustand an, in dem es sich früher befand, so dass sein Glaube an die Qualität dieser Aktion näher an der Realität der Belohnung und an der Qualität des Ortes liegt, an dem sie durchgeführt wurde endete.

e. Der Agent wiederholt die Schritte bd für immer. Mit der Zeit werden seine Überzeugungen über die Qualität verschiedener Zustands- / Aktionspaare konvergieren, um der Realität immer näher zu kommen.

Ein Beispiel für eine Anwendung, die Lernen verwendet, sind AI.SEs Empfehlungen, die von einem Programm erstellt werden, das wahrscheinlich die Beziehungen zwischen verschiedenen Wortkombinationen in Paaren von Beiträgen und die Wahrscheinlichkeit analysiert, dass jemand darauf klickt. Jedes Mal, wenn jemand auf sie klickt, erfährt er, ob es eine gute Idee ist, einen Beitrag als verwandt aufzulisten oder nicht. Der Feed von Facebook ist ein weiteres alltägliches Beispiel.

— John Doucette
quelle

0

Eine Möglichkeit, sich den Unterschied zwischen Suchen und Lernen vorzustellen, besteht darin, dass die Suche normalerweise einen Suchschlüssel umfasst und ein Algorithmus durch die Struktur sucht, um eine Übereinstimmung zwischen dem Schlüssel und einem bereits vorhandenen Element zu finden. Während Lernen in erster Linie die Schaffung der Struktur ist. Suchen und Lernen hängen jedoch damit zusammen, dass beim Empfang einer Eingabe (z. B. von einem oder mehreren Sensoren) die Struktur zunächst durchsucht wird, um festzustellen, ob die Eingabe bereits vorhanden ist, wenn dies jedoch nicht der Fall ist, die aktuelle Eingabe (wenn bestimmte Bedingungen erfüllt sind). wird der Struktur hinzugefügt, und das Lernen folgt einem Suchfehler.

— Roddus
quelle