Mein vorgeschlagener Ansatz umfasst Modelle, die viel allgemeiner sind als ARIMA, da sie das Potenzial für saisonale Dummies enthalten, die sich im Laufe der Zeit ändern können, mehrere Ebenen, mehrere Trends, Parameter, die sich im Laufe der Zeit ändern können, und sogar Fehlervarianzen, die sich im Laufe der Zeit ändern können. Diese Familie wird genauer als ARMAX-Modelle bezeichnet, schließt jedoch aus Gründen der vollständigen Transparenz eine (seltene) Variante mit multiplikativer Struktur aus.
Sie haben um Tipps gebeten, und ich bin der Meinung, dass dies eine gute Lösung sein könnte, um Ihnen den Einstieg zu erleichtern.
Ich würde vorschlagen, dass Sie Code schreiben, um diesem Flussdiagramm / Workflow zu folgen / zu emulieren. Das "beste Modell" kann durch Auswertung des von Ihnen angegebenen Kriteriums ermittelt werden. Dies kann die MSE / AIC der angepassten Daten oder die MAPE / SMAPE der zurückgehaltenen Daten oder ein beliebiges Kriterium Ihrer Wahl sein.
Seien Sie sich bewusst, dass die Detaillierung jedes dieser Schritte recht einfach sein kann, wenn Sie einige der spezifischen Anforderungen / Ziele / Einschränkungen der Zeitreihenanalyse nicht kennen, ABER es kann (sollte!) Komplexer sein, wenn Sie ein tieferes Verständnis haben / Lernen / Erkennen der Komplexität / Chancen einer gründlichen Zeitreihenanalyse.
Ich wurde gebeten, weitere Anweisungen für die Automatisierung der Zeitreihenmodellierung (oder der Modellierung im Allgemeinen) zu geben. Https://stats.stackexchange.com/search?q=peeling+an+onion enthält einige meiner Anleitungen zu "Zwiebeln schälen" und damit verbundene Aufgaben.
AUTOBOX beschreibt und zeigt die Zwischenschritte, da es ein nützliches Modell darstellt und in dieser Hinsicht ein nützlicher Lehrer sein könnte. Die ganze wissenschaftliche Idee besteht darin, "das hinzuzufügen, was als notwendig erscheint" und "das zu löschen, was als weniger nützlich erscheint". Dies ist der iterative Prozess, den Box und Bacon in früheren Zeiten vorgeschlagen haben.
Modelle müssen komplex genug (ausgefallen), aber nicht zu komplex (ausgefallen) sein. Die Annahme, dass einfache Methoden mit komplexen Problemen funktionieren, steht nicht im Einklang mit der wissenschaftlichen Methode nach Roger Bacon und Tonnen von Anhängern von Bacon. Wie Roger Bacon einmal sagte und ich oft umschrieb: Wissenschaft zu betreiben bedeutet, nach wiederholten Mustern zu suchen. Anomalien zu erkennen bedeutet, Werte zu identifizieren, die nicht wiederholten Mustern folgen. Denn wer die Wege der Natur kennt, wird ihre Abweichungen leichter bemerken, und wer sie kennt, wird ihre Wege genauer beschreiben. Man lernt die Regeln, indem man beobachtet, wann die aktuellen Regeln versagen. Wenn man erkennt, wann das aktuell identifizierte "beste Modell / Theorie" unzureichend ist, kann man zu einer "besseren Darstellung" iterieren.
In meinen Worten "schlug Tukey Exploratory Data Analysis (EDA) vor, die Schemata der Modellverfeinerung vorschlug, die auf offensichtlichen Modellmängeln beruhten, die von den Daten vorgeschlagen wurden". Dies ist das Herz von AUTOBOX und der Wissenschaft. EDA dient dazu zu sehen, was uns die Daten über die formale Modellierungs- oder Hypothesentestaufgabe hinaus sagen können.
Der Lackmustest eines automatischen Modellierungsprogramms ist recht einfach. Trennt es Signal und Rauschen ohne Überanpassung? Empirische Beweise legen nahe, dass dies möglich und möglich ist. Prognosegenauigkeiten sind oft irreführend, da die Zukunft nicht für die Vergangenheit verantwortlich ist und je nach Herkunft die Ergebnisse variieren können.