Ich habe eine Frage zu Methoden der Schauspielerkritik beim Lernen zur Stärkung.
In diesen Folien ( https://hadovanhasselt.files.wordpress.com/2016/01/pg1.pdf ) werden verschiedene Arten von Schauspieler-Kritikern erläutert. Vorteil Schauspieler Kritiker und TD Schauspieler Kritiker werden auf der letzten Folie erwähnt:
Wenn ich mir aber die Folie "Schätzen der Vorteilsfunktion (2)" anschaue, heißt es, dass die Vorteilsfunktion durch den td-Fehler angenähert werden kann. Dann enthält die Aktualisierungsregel den td-Fehler auf dieselbe Weise wie bei TD Actor Critical.
Also ist Vorteilsschauspielerkritiker und td Schauspielerkritiker eigentlich gleich? Oder gibt es einen Unterschied, den ich nicht sehe?