Ist betreutes Lernen eine Untergruppe des Bestärkungslernens?


Antworten:


24

Es ist wahr, dass jedes überwachte Lernproblem als äquivalentes Verstärkungslernproblem gewertet werden kann: Lassen Sie die Zustände den Eingabedaten entsprechen. Lassen Sie Aktionen Vorhersagen der Ausgabe entsprechen. Definieren Sie Belohnung als das Negativ der Verlustfunktion, die für überwachtes Lernen verwendet wird. Maximieren Sie die erwartete Belohnung. Im Gegensatz dazu können Lernprobleme bei der Verstärkung im Allgemeinen nicht als überwachte Lernprobleme gewertet werden. Aus dieser Perspektive sind überwachte Lernprobleme eine Untergruppe von Problemen des verstärkten Lernens.

Der Versuch, ein betreutes Lernproblem mit einem allgemeinen Algorithmus für das verstärkte Lernen zu lösen, wäre jedoch ziemlich sinnlos. Alles, was dies bewirkt, ist, Strukturen wegzuwerfen, die die Lösung des Problems erleichtert hätten. Beim verstärkten Lernen treten verschiedene Probleme auf, die für überwachtes Lernen nicht relevant sind. Und betreutes Lernen kann von Ansätzen profitieren, die in der allgemeinen Lernumgebung für Verstärkung nicht zutreffen. Obwohl es einige gemeinsame Prinzipien und gemeinsame Techniken zwischen den Bereichen gibt, wird überwachtes Lernen in der Regel nicht als eine Art des verstärkenden Lernens betrachtet.

Verweise

Barto und Dietterich (2004) . Stärkung des Lernens und seiner Beziehung zu überwachtem Lernen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.