Als «reinforcement-learning» getaggte Fragen

7
Wie trainiere ich ein künstliches neuronales Netzwerk, um Diablo 2 mit visuellen Eingaben zu spielen?
Ich versuche gerade, eine ANN dazu zu bringen, ein Videospiel zu spielen, und ich hatte gehofft, Hilfe von der wunderbaren Community hier zu bekommen. Ich habe mich für Diablo 2 entschieden. Das Spiel ist also in Echtzeit und aus isometrischer Sicht, wobei der Spieler einen einzelnen Avatar steuert, auf den …

4
Was ist der Unterschied zwischen Wertiteration und Richtlinieniteration?
Was ist der Unterschied zwischen Richtlinieniteration und Wertiteration beim verstärkten Lernen ? Soweit ich weiß, verwenden Sie bei der Wertiteration die Bellman-Gleichung, um die optimale Richtlinie zu ermitteln, während Sie bei der Richtlinieniteration zufällig eine Richtlinie π auswählen und die Belohnung für diese Richtlinie ermitteln. Mein Zweifel ist, dass, wenn …

6
Was ist der Unterschied zwischen Q-Learning und SARSA?
Obwohl ich weiß, dass SARSA nicht den Richtlinien entspricht, während Q-Learning nicht den Richtlinien entspricht, ist es (für mich) schwierig, bei der Betrachtung ihrer Formeln einen Unterschied zwischen diesen beiden Algorithmen festzustellen. Nach dem Buch Reinforcement Learning: An Introduction (von Sutton und Barto). In dem SARSA-Algorithmus kann bei gegebener Richtlinie …


1
TypeError: len ist für symbolische Tensoren nicht gut definiert. (Aktivierung_3 / Identität: 0) Bitte rufen Sie "x.shape" anstelle von "len (x)" auf, um Informationen zur Form zu erhalten
Ich versuche, ein DQL-Modell für ein Spiel von openAI Gym zu implementieren. Aber es gibt mir folgenden Fehler. TypeError: len ist für symbolische Tensoren nicht gut definiert. (Aktivierung_3 / Identität: 0) Bitte x.shapeeher anrufen alslen(x) Informationen zur Form zu erhalten. Erstellen einer Fitnessumgebung: ENV_NAME = 'CartPole-v0' env = gym.make(ENV_NAME) np.random.seed(123) …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.