Ich habe einen Zeitreihendatensatz, an den ich ein Hidden Markov Model (HMM) anpasse, um die Anzahl der latenten Zustände in den Daten abzuschätzen. Mein Pseudocode dafür ist der folgende:
for( i in 2 : max_number_of_states ){
...
calculate HMM with i states
...
optimal_number_of_states = "model with smallest BIC"
...
}
In den üblichen Regressionsmodellen tendiert der BIC dazu, die sparsamsten Modelle zu bevorzugen, aber im Fall des HMM bin ich nicht sicher, ob es das ist, was es tut. Weiß jemand, zu welcher Art von HMM das BIC-Kriterium tendiert? Ich kann auch den AIC- und Likelihood-Wert ermitteln. Ist eines dieser Kriterien für diesen Zweck "besser" als das andere, da ich versuche, die tatsächliche Gesamtzahl der Zustände zu ermitteln?