Was ist eine gute Quelle, um sich mit dem verstärkten Lernen vertraut zu machen?


8

Ich bin mit überwachtem und unbeaufsichtigtem Lernen vertraut. Ich habe den SaaS-Kurs von Andrew Ng auf Coursera.org gemacht.

Ich suche etwas Ähnliches für das verstärkte Lernen.

Kannst du etwas empfehlen?

Antworten:


5

Zu den guten Antworten hier möchte ich hinzufügen

Diese kratzen kaum an der Oberfläche von RL, aber sie sollten Ihnen den Einstieg erleichtern.


3

Es gibt eine Youtube-Wiedergabeliste (im DeepMind-Kanal ) mit dem Titel Einführung in das Bestärkungslernen. Dies ist ein Kurs (mit 10 Lektionen) zum Bestärkungslernen von David Silver .

Eine Person, die den Kurs verfolgte und beendete, schrieb (als Youtube-Kommentar):

Ausgezeichneter Kurs. Gut geschritten, genug Beispiele, um eine gute Intuition zu vermitteln, und von jemandem unterrichtet, der bei der Anwendung von RL auf Spiele führend ist.


3

Fragen Sie sich vorher, ob Sie wirklich etwas über "Verstärkungslernen" lernen möchten. Obwohl es viel Hype um das Lernen von Verstärkung gibt, gibt es kaum eine reale Anwendbarkeit des Lernens von Verstärkung. In den meisten Online-Kursen lernen Sie ein wenig über maschinelles Lernen. Daher ist es viel besser, gründlich damit umzugehen, als sich dem verstärkten Lernen zuzuwenden. Das Lernen zur Stärkung des Lernens unterscheidet sich etwas vom Lernen über unbeaufsichtigte / überwachte Lerntechniken.

Der schnellste Weg, um ein gutes Verständnis für das Lernen der Stärkung zu erlangen, ist jedoch folgender:

  1. Lesen Sie den Blog-Beitrag von Andrej Karpathy "Pong from Pixels".

  2. Sehen Sie sich Deep RL Bootcamp-Vorträge an .

  3. Um die Mathematik hinter diesen Techniken zu verstehen, lesen Sie Sutton und Bartos Reinforcement Learning: Eine Einführung .

  4. Lesen Sie relevante Artikel (Spielen usw.).

PS: Stellen Sie sicher, dass Sie mit den Grundlagen neuronaler Netze vertraut sind, da die meisten aktuellen Artikel in RL die Verwendung von DNNs auf die eine oder andere Weise als Approximatoren beinhalten.


real-world applicability of reinforcement learning is almost non-existent AlphaGo wurde mit verstärkendem Lernen trainiert.
Cantordust

Danke, was ich am verstärkenden Lernen mag, ist, dass es sich verbessern kann, indem es die Aufgabe immer und immer wieder erledigt. Es ist keine Überwachung erforderlich. Nur das Modell muss das Problem richtig beschreiben.
Martin S

1
@ Cantordust, überprüfen Sie alexirpan.com/2018/02/14/rl-hard.html
riemann77

@thecomplexitytheorist Ja, mir ist dieser Beitrag bekannt, und ja, mit RL sind Schwierigkeiten verbunden (wie bei jeder anderen ML-Methode). Diese Schwierigkeiten bedeuten jedoch nicht, dass ihre Anwendbarkeit gleich Null ist. Ein weiteres erfolgreiches Beispiel (auch in der Veröffentlichung erwähnt) ist die Verbesserung der Kühleffizienz der Rechenzentren von Google um 40% - kaum unbedeutend.
Cantordust

1
@cantordust, Sie sollten diesen Beitrag vollständig lesen. Es gibt kein "Verstärkungslernen", das mit der "Verbesserung der Kühleffizienz" verbunden ist. Sie haben klar erwähnt, dass sie Vorhersagen auf der Grundlage früherer Stromverbrauchsdaten getroffen haben.
Riemann77


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.