Asymptotisch entspricht die Minimierung des AIC der Minimierung der ausgelassenen Kreuzvalidierungs-MSE für Querschnittsdaten [ 1 ]. Wenn wir also AIC haben, warum verwendet man überhaupt die Methode der Aufteilung der Daten in Trainings-, Validierungs- und Testsätze, um die Vorhersageeigenschaften von Modellen zu messen? Was genau sind die Vorteile dieser Praxis?
Ich kann mir einen Grund vorstellen: Wenn man die Vorhersageleistungen der Modelle bewerten möchte, ist eine Analyse außerhalb der Stichprobe nützlich. Aber obwohl AIC kein Maß für die Prognose ist die Genauigkeit , hat man in der Regel eine gute Idee , wenn einige Modell ihr maximales Potenzial erreicht (für die Daten eines gegeben ist) in Bezug darauf, wie gut Sie sind Gonna der Lage sein , vorherzusagen.