Ich versuche die berühmte Zeitung "Atari spielen mit Deep Reinforcement Learning" ( pdf ) zu verstehen . Mir ist der Unterschied zwischen einer Epoche und einer Episode unklar . In Algorithmus befindet sich die äußere Schleife über Episoden , während in Abbildung 2 die x-Achse als Epoche bezeichnet ist . Im Zusammenhang mit dem verstärkten Lernen ist mir nicht klar, was eine Epoche bedeutet. Ist eine Epoche eine äußere Schleife um die Episodenschleife?