Antworten:
Zu den guten Antworten hier möchte ich hinzufügen
Ein kurzer Überblick über RL : Die wichtigsten Konzepte an einem Ort.
Eine weitere kurze Übersicht im Präsentationsformat.
Ben Recht's Eine Außenseiter-Tour durch RL ist ziemlich umfassend und zugänglich.
Die Bellman-Gleichungen : zentral für die gesamte RL-Theorie.
Von Andrej Karpathy erklärte Richtlinienverläufe (in anderen Antworten als "Pong von Pixeln" erwähnt, dies ist der Link).
Diese kratzen kaum an der Oberfläche von RL, aber sie sollten Ihnen den Einstieg erleichtern.
Es gibt eine Youtube-Wiedergabeliste (im DeepMind-Kanal ) mit dem Titel Einführung in das Bestärkungslernen. Dies ist ein Kurs (mit 10 Lektionen) zum Bestärkungslernen von David Silver .
Eine Person, die den Kurs verfolgte und beendete, schrieb (als Youtube-Kommentar):
Ausgezeichneter Kurs. Gut geschritten, genug Beispiele, um eine gute Intuition zu vermitteln, und von jemandem unterrichtet, der bei der Anwendung von RL auf Spiele führend ist.
Fragen Sie sich vorher, ob Sie wirklich etwas über "Verstärkungslernen" lernen möchten. Obwohl es viel Hype um das Lernen von Verstärkung gibt, gibt es kaum eine reale Anwendbarkeit des Lernens von Verstärkung. In den meisten Online-Kursen lernen Sie ein wenig über maschinelles Lernen. Daher ist es viel besser, gründlich damit umzugehen, als sich dem verstärkten Lernen zuzuwenden. Das Lernen zur Stärkung des Lernens unterscheidet sich etwas vom Lernen über unbeaufsichtigte / überwachte Lerntechniken.
Der schnellste Weg, um ein gutes Verständnis für das Lernen der Stärkung zu erlangen, ist jedoch folgender:
Lesen Sie den Blog-Beitrag von Andrej Karpathy "Pong from Pixels".
Sehen Sie sich Deep RL Bootcamp-Vorträge an .
Um die Mathematik hinter diesen Techniken zu verstehen, lesen Sie Sutton und Bartos Reinforcement Learning: Eine Einführung .
Lesen Sie relevante Artikel (Spielen usw.).
PS: Stellen Sie sicher, dass Sie mit den Grundlagen neuronaler Netze vertraut sind, da die meisten aktuellen Artikel in RL die Verwendung von DNNs auf die eine oder andere Weise als Approximatoren beinhalten.
Ich habe kürzlich einen Kurs von Microsoft über edx gesehen. Es heißt "Reinforcement Learning Explained".
Hier ist der Link: https://www.edx.org/course/reinforcement-learning-explained-0 Dies ist nicht ganz umfassend, bietet aber zumindest einen guten Ausgangspunkt.
Ich würde sagen, dieser Beitrag ist ein Muss zu lesen:
https://rubenfiszel.github.io/posts/rl4j/2016-08-24-Reinforcement-Learning-and-DQN.html
real-world applicability of reinforcement learning is almost non-existent
AlphaGo wurde mit verstärkendem Lernen trainiert.