Ich verwende die VAR-Bibliothek für Python-Statistikmodelle, um finanzielle Zeitreihendaten zu modellieren, und einige Ergebnisse haben mich verwirrt. Ich weiß, dass VAR-Modelle davon ausgehen, dass die Zeitreihendaten stationär sind. Ich habe versehentlich eine instationäre Reihe von Log-Preisen für zwei verschiedene Wertpapiere angepasst, und überraschenderweise waren die angepassten Werte und Prognosen in der Stichprobe mit relativ unbedeutenden stationären Residuen sehr genau. Der Wert für die Prognose in der Stichprobe betrug 99% und die Standardabweichung der prognostizierten Restreihen betrug etwa 10% der Prognosewerte.
Wenn ich jedoch die Log-Preise differenziere und diese Zeitreihen an das VAR-Modell anpasse, liegen die angepassten und prognostizierten Werte weit hinter der Marke und bewegen sich in einem engen Bereich um den Mittelwert. Infolgedessen können die Residuen die Protokollrenditen besser prognostizieren als die angepassten Werte, wobei die Standardabweichung der prognostizierten Residuen 15-mal größer ist als die der angepassten Datenreihe und ein Wert von 0,007 für die Prognoseserie.
Interpretiere ich angepasste oder Residuen im VAR-Modell falsch oder mache ich einen anderen Fehler? Warum würde eine instationäre Zeitreihe zu genaueren Vorhersagen führen als eine stationäre, die auf denselben zugrunde liegenden Daten basiert? Ich habe ein gutes Stück mit ARMA-Modellen aus derselben Python-Bibliothek gearbeitet und nichts Vergleichbares zu dieser Modellierung einzelner Seriendaten gesehen.