Techniken zum inkrementellen Online-Lernen von Klassifikatoren für Stream-Daten


9

Welche Techniken könnten gut sein, um diesem abstrakten Problem zu begegnen?

Sie haben einen Datenstrom eines kontinuierlichen Signals als einen von einem physischen Sensor. Dieses Signal hat reale (diskretisierte) Werte, kein Attribut; Suchtmerkmale (z. B. Leistung, Autokorrelation, Entropie) können extrahiert werden. Sie können einem Fenster des Signals eine Bezeichnung aus einer endlichen Menge zuweisen. Lassen Sie dieses Label ein Trainingslabel sein . Sie müssen den Start- und Endpunkt des Fensters sowie die Fensterbezeichnung auswählen.

Die Aufgabe besteht darin, die nächsten Fenster online so zu klassifizieren, wie das Signal empfangen wird.

Ich fordere einen inkrementellen Algorithmus in dem Sinne, dass er seine Erkennungsleistung bei mehr Trainingsetiketten erhöhen sollte. Aber es muss auch nach nur einem Trainingslabel klassifizieren können.

Wenn sich das Problem aufgrund der Erkennung von Fenstergrenzen als zu schwierig herausstellt, können Sie deren Größe auf eine kleine Konstante festlegen. Somit klassifiziert der Algorithmus kleine Schichten des Signals und führt dann benachbarte mit denselben Bezeichnungen zusammen. Wenn Sie diesen vereinfachten Ansatz verwenden, begründen Sie bitte, warum dies angemessen ist.

Antworten:


2

Wenn dies ein binäres Klassifizierungsproblem ist, sollte es möglich sein, eine Online-SVM wie Bordes, A. und Bottou, L. , "The Huller: eine einfache und effiziente Online-SVM", ECML 2005 , anzuwenden .

Wenn dies eine nicht-binäre Klassifizierung ist (dh mehr als 2 mögliche Bezeichnungen), können Sie sich mit rekursiven Kernel-Techniken der kleinsten Quadrate befassen. Sie sind für die Online-Regression konzipiert, eignen sich aber auch für die Online-Klassifizierung recht gut. Hier ist ein grundlegender KRLS-Algorithmus: Y. Engel, S. Mannor und R. Meir , "The Kernel Recusrive Least Squares Algorithm", IEEE Trans. Signalverarbeitung, 2004 .

Beide Ansätze erfordern feste Fenstergrößen, um Eingabevektoren derselben Größe zu vergleichen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.