Als «reinforcement-learning» getaggte Fragen

Eine Reihe dynamischer Strategien, mit denen ein Algorithmus die Struktur einer Umgebung online lernen kann, indem er adaptiv Aktionen ausführt, die mit verschiedenen Belohnungen verbunden sind, um die erzielten Belohnungen zu maximieren.

5
Was ist der Unterschied zwischen off-policy und on-policy Lernen?
Die Website für künstliche Intelligenz definiert das Lernen außerhalb der Politik und innerhalb der Politik wie folgt: "Ein außervertraglicher Lernender lernt den Wert der optimalen Richtlinie unabhängig von den Aktionen des Agenten. Q-Learning ist ein außervertraglicher Lernender. Ein außervertraglicher Lernender lernt den Wert der Richtlinie, die vom Agenten ausgeführt wird, …




2
Betreutes Lernen, unbeaufsichtigtes Lernen und Bestärkungslernen: Workflow-Grundlagen
Überwachtes Lernen 1) Ein menschliches baut einen Klassifizierer basierend auf Eingabe und Ausgabedaten 2) Dieser Klassifikator wird mit einem Trainingsdatensatz trainiert 3) Dieser Klassifikator wird mit einem Testdatensatz getestet 4) Bereitstellung, wenn die Ausgabe zufriedenstellend ist Um verwendet zu werden, wenn "Ich weiß, wie man diese Daten klassifiziert, ich brauche …


3
Tägliche Zeitreihenanalyse
Ich versuche eine Zeitreihenanalyse durchzuführen und bin neu in diesem Bereich. Ich habe eine tägliche Zählung eines Ereignisses von 2006-2009 und möchte ein Zeitreihenmodell dazu passen. Hier sind die Fortschritte, die ich gemacht habe: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) Das resultierende Diagramm, das ich erhalte, ist: Um zu überprüfen, ob Saisonalität …


2
Was ist wiederkehrendes Verstärkungslernen?
Ich bin kürzlich auf das Wort "Recurrent Reinforcement Learning" gestoßen. Ich verstehe, was "Recurrent Neural Network" ist und was "Reinforcement Learning" ist, konnte aber nicht viele Informationen darüber finden, was "Recurrent Reinforcement Learning" ist. Kann mir jemand erklären, was ein "Recurrent Reinforcement Learning" ist und was der Unterschied zwischen "Recurrent …



1
Wann sollten Sie SARSA vs. Q Learning wählen?
SARSA und Q Learning sind beide Verstärkungslernalgorithmen, die auf ähnliche Weise funktionieren. Der auffälligste Unterschied ist, dass SARSA in der Politik ist, während Q Learning nicht in der Politik ist. Die Update-Regeln lauten wie folgt: Q Lernen: Q ( st, eint) ← Q ( st, eint) + α [ rt …




Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.