Dies ist eine recht allgemeine Frage: Angenommen, ich möchte ein Modell erstellen, um die nächste Beobachtung basierend auf den vorherigen Beobachtungen vorherzusagen ( kann ein Parameter zur experimentellen Optimierung sein). Wir haben also im Grunde ein Schiebefenster mit Eingabemerkmalen, um die nächste Beobachtung vorherzusagen.N.
Ich kann einen Hidden-Markov-Modell-Ansatz verwenden, dh Baum-Welch, um ein Modell zu schätzen, dann Viterbi, um einen aktuellen Zustand basierend auf den letzten Beobachtungen vorherzusagen, dann den wahrscheinlichsten nächsten Zustand basierend auf dem aktuellen Zustand vorherzusagen und dann den nächsten vorherzusagen Beobachtung unter Verwendung des wahrscheinlichsten nächsten Zustands und der HMM-Parameter (oder Varianten wie das Finden der prädiktiven Verteilung der nächsten Beobachtung).
Oder ich kann einen viel einfacheren Ansatz verwenden, indem ich ein zustandsloses Modell verwende (das als Eingabe die vorherigen Beobachtungen erhalten kann), z. B. SVM, lineare Regression, Splines, Regressionsbäume, nächste Nachbarn usw. Solche Modelle basieren auf der Minimierung einiger Vorhersagefehler über den Trainingssatz und sind daher konzeptionell viel einfacher als ein auf verborgenen Zuständen basierendes Modell.
Kann jemand seine / ihre Erfahrungen im Umgang mit einer solchen Modellierungsentscheidung teilen? Was würde für das HMM sprechen und was für einen Regressionsansatz? Intuitiv sollte man das einfachere Modell wählen, um eine Überanpassung zu vermeiden. Dies spricht für einen zustandslosen Ansatz ... Wir müssen auch berücksichtigen, dass beide Ansätze die gleichen Eingabedaten für das Training erhalten (ich denke, dies impliziert, dass, wenn wir kein zusätzliches Domänenwissen in die Modellierung eines Hidden-State-Modells einbeziehen, z Wenn Sie bestimmte Zustände und Übergangswahrscheinlichkeiten festlegen, gibt es keinen Grund, warum ein Modell mit versteckten Zuständen eine bessere Leistung erzielen sollte. Am Ende kann man natürlich mit beiden Ansätzen spielen und sehen, was bei einem Validierungssatz besser abschneidet, aber einige Heuristiken, die auf praktischen Erfahrungen basieren, könnten auch hilfreich sein ...
Hinweis: Für mich ist es wichtig, nur bestimmte Ereignisse vorherzusagen. Ich bevorzuge ein Modell, das wenige "interessante / seltene" Ereignisse gut vorhersagt, anstatt ein Modell, das "durchschnittliche / häufige" Ereignisse vorhersagt, aber die interessanten nicht so gut. Vielleicht hat dies Auswirkungen auf die Wahl der Modellierung. Vielen Dank.