Ich bin kürzlich auf mehrere "informelle" Quellen gestoßen, die darauf hinweisen, dass wir unter bestimmten Umständen, wenn wir den AIC oder BIC zum Trainieren eines Zeitreihenmodells verwenden, die Daten nicht in Test und Training aufteilen müssen - wir können alle verwenden die Daten für das Training. (Zu den Quellen gehören unter anderem eine Diskussion über Rob Hyndmans Blogbeitrag zum Lebenslauf , diese Präsentation von Stanford oder Abschnitt 4 dieses Textes ).
Insbesondere scheinen sie darauf hinzudeuten, dass der AIC oder BIC verwendet werden kann, wenn der Datensatz zu klein ist, um eine Zug- / Testaufteilung zu ermöglichen.
Rob Hyndmans Kommentar zum Beispiel: "Es ist viel effizienter, AIC / BIC zu verwenden, als Testsätze oder Lebensläufe zu verwenden, und es wird wichtig für kurze Zeitreihen, in denen nicht genügend Daten vorhanden sind, um etwas anderes zu tun."
Ich kann jedoch keine Texte oder Papiere finden, die dies im Detail diskutieren.
Eine Sache, die mich besonders verwirrt, ist, dass AIC und BIC asymptotisch zur Kreuzvalidierung tendieren, was bedeutet, dass sie, wenn möglich, den Lebenslauf für große Datenmengen ersetzen würden - was der Idee widerspricht, dass sie für kleine Datenmengen nützlich sind.
Kann mich jemand auf eine formelle Diskussion (Buchkapitel, Artikel, Tutorials) dieser Idee hinweisen?