Überwachtes Lernen
- 1) Ein menschliches baut einen Klassifizierer basierend auf Eingabe und Ausgabedaten
- 2) Dieser Klassifikator wird mit einem Trainingsdatensatz trainiert
- 3) Dieser Klassifikator wird mit einem Testdatensatz getestet
- 4) Bereitstellung, wenn die Ausgabe zufriedenstellend ist
Um verwendet zu werden, wenn "Ich weiß, wie man diese Daten klassifiziert, ich brauche nur Sie (den Klassifizierer), um sie zu sortieren."
Methodenkomponente: Zum Klassifizieren von Beschriftungen oder zum Erzeugen reeller Zahlen
Unbeaufsichtigtes Lernen
- 1) Ein menschliches baut einen Algorithmus basierend auf Eingangsdaten
- 2) Dieser Algorithmus wird mit einem Testdatensatz getestet (in dem der Algorithmus den Klassifikator erstellt).
- 3) Einsatz, wenn der Klassifikator zufriedenstellend ist
Um verwendet zu werden, wenn "Ich habe keine Ahnung, wie ich diese Daten klassifizieren soll. Können Sie (der Algorithmus) einen Klassifikator für mich erstellen?"
Methodenpunkt: Etiketten klassifizieren oder vorhersagen (PDF)
Verstärkung lernen
- 1) Ein menschliches baut einen Algorithmus basierend auf Eingangsdaten
- 2) Dieser Algorithmus stellt einen Zustand dar, der von den Eingabedaten abhängt, in denen ein Benutzer den Algorithmus über die vom Algorithmus ausgeführte Aktion belohnt oder bestraft. Dies setzt sich über die Zeit fort
- 3) Dieser Algorithmus lernt aus der Belohnung / Bestrafung und aktualisiert sich, dies geht weiter
- 4) Es ist immer in Produktion, es muss reale Daten lernen, um Aktionen von Staaten darstellen zu können
Zu verwenden, wenn: "Ich habe keine Ahnung, wie ich diese Daten klassifizieren soll. Können Sie diese Daten klassifizieren und ich werde Ihnen eine Belohnung geben, wenn sie korrekt sind, oder ich werde Sie bestrafen, wenn sie nicht korrekt sind."
Ist dies der Fluss dieser Praktiken? Ich höre viel darüber, was sie tun, aber die praktischen und beispielhaften Informationen sind erschreckend wenig!