Lehrbuch über Bestärkungslernen


12

Ich suche ein Lehrbuch / Vorlesungsskript zum Lernen der Verstärkung. Ich mag die "Einführung in das statistische Lernen" , aber leider wird dieses Thema nicht behandelt. Ich weiß, dass ein Buch von Sutton und Barto eine Standardreferenz ist, und vielleicht ist NDP auch gut, aber sie sind von 1997 bis 1998 datiert, und ich hatte gehofft, eine modernere Ausstellung zu finden, da dieses Gebiet in letzter Zeit wahrscheinlich eine gewisse Entwicklung haben wird Zeit.

Antworten:


15

Ich denke, Sutton und Barto sind immer noch der Standard. Es sind viele Dia-Decks und Notizen aus KI-Klassen online, aber sie gehen normalerweise nicht zu sehr ins Detail.

Sutton und Barto sind ein bisschen alt, aber sie bereiten eine zweite Ausgabe ihres Lehrbuchs vor. Ein Entwurf vom Januar 2018 ist hier verfügbar . Es ist von Suttons Webseite verlinkt , die auch den vollständigen Text der ersten Ausgabe enthält.

TD (λ) , gegenüber sieben Chapers und 150 Seiten im neueren Sutton und Barto.

Abgesehen davon könnten Sie versuchen, in einige Artikel einzutauchen - das Lernmaterial zur Verstärkung ist in der Regel ziemlich zugänglich.


Danke, ich habe mir die neue Ausgabe angesehen, aber ich würde nicht sagen, dass sie sehr aktualisiert ist. Ich bin immer noch an einer aktuelleren Belichtung interessiert.
Ulysses

Ja, es ist definitiv keine vollständige Überarbeitung, aber außer einigen Bänden von Springers "Lecture Notes", die im Wesentlichen nur Sammlungen von Papieren sind, fällt mir nichts anderes ein. Wenn Sie etwas anderes finden, veröffentlichen Sie bitte ein Update. Ich würde es gerne ausprobieren.
Matt Krause

Ich sehe, sicher werde ich tun
Ulysses

1
@ CharlieParker, ich bin nicht sicher. Der jüngste Entwurf (19. Juni 2017) sieht ziemlich vollständig aus und erwähnt MIT Press, aber die MIT Press-Website scheint die erste Ausgabe noch zu verkaufen. Der Entwurf stammt direkt von der öffentlichen Website der Autoren, sodass Sie sich keine Gedanken über die Verwendung einer "durchgesickerten" Version oder Ähnlichem machen müssen.
Matt Krause

1
@ Thomas, ich habe den Link mit einem neueren Entwurf aktualisiert.
Matt Krause

6

Vielleicht möchten Sie sich die Algorithmen für das Reinforcement Learning von Csaba Szepesvári ansehen, die 2010 veröffentlicht wurden. PDF kann von der Website heruntergeladen werden. Meiner Meinung nach ist es etwas technischer als Sutton und Barto, deckt aber weniger Material ab.


6

Hier haben Sie einige gute Lehrbücher / Referenzen:

Klassisch

Sutton RS, Barto AG. Reinforcement Learning: Eine Einführung. Cambridge, Mass: Ein Bradford-Buch; 1998. 322 p.

Der Entwurf für die zweite Ausgabe ist kostenlos erhältlich: https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html

Russell / Norvig Kapitel 21:

Russell SJ, Norvig P, Davis E. Künstliche Intelligenz: ein moderner Ansatz. Upper Saddle River, New Jersey: Prentice Hall; 2010.

Technischer

Szepesvári C. Algorithmen zum verstärkten Lernen. Synthesevorträge zu künstlicher Intelligenz und maschinellem Lernen. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Dynamische Programmierung und optimale Steuerung. 4. Auflage. Belmont, Mass.: Athena Scientific; 2007. 1270 p. Kapitel 6, Band 2 ist kostenlos verfügbar: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Für neuere Entwicklungen

Wiering M, van Otterlo M, Herausgeber. Verstärkungslernen. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Verfügbar ab: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Entscheidungsfindung unter Unsicherheit: Theorie und Anwendung. 1 Ausgabe. Cambridge, Massachusetts: Die MIT-Presse; 2015. 352 p.

Multi-Agent-Verstärkungslernen

Buşoniu L, Babuška R, Schutter BD. Multi-Agent Reinforcement Learning: Ein Überblick. In: Srinivasan D, Jain LC, Herausgeber. Innovationen in Multi-Agent-Systemen und -Anwendungen - 1. Springer Berlin Heidelberg; 2010 p. 183–221. Verfügbar unter: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Maschinelles Lernen mit mehreren Agenten: ein Ansatz zur Verstärkung. Hoboken, New Jersey: Wiley Wiley; 2014.

Videos / Kurse

Ich würde auch David Silver Kurs in YouTube vorschlagen: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.