Ich werde versuchen, auf den sanften Drang von whuber zu antworten, einfach auf die Frage zu antworten und beim Thema zu bleiben. Wir erhalten 144 monatliche Lesungen einer Serie namens "The Airline Series". Box und Jenkins wurden allgemein dafür kritisiert, eine Prognose zu liefern, die aufgrund der „explosiven Natur“ einer umgekehrten protokollierten Transformation einen hohen Stellenwert hatte.
Visuell haben wir den Eindruck, dass die Varianz der Originalserie mit der Höhe der Serie zunimmt, was auf einen Transformationsbedarf hindeutet. Wir wissen jedoch, dass eine der Voraussetzungen für ein nützliches Modell ist, dass die Varianz der „Modellfehler“ homogen sein muss. Es sind keine Annahmen über die Varianz der Originalserie erforderlich. Sie sind identisch, wenn das Modell einfach eine Konstante ist, dh y (t) = u. Wie https://stats.stackexchange.com/users/2392/probabilityislogic in seiner Antwort auf die Empfehlung zur Erklärung von Heterogenität / Heteroscedasticty so deutlich formuliert hat, ist „eine Sache, die ich immer amüsant finde, diese„ Nicht-Normalität der Daten “, die die Menschen beunruhigen Über. Die Daten müssen nicht normal verteilt werden, der Fehlerbegriff jedoch. “
Frühe Arbeiten in Zeitreihen ließen oft fälschlicherweise Rückschlüsse auf ungerechtfertigte Transformationen zu. Wir werden hier feststellen, dass die Abhilfemaßnahme für diese Daten darin besteht, dem ARIMA-Modell einfach drei Indikator-Dummy-Reihen hinzuzufügen, die eine Anpassung für drei ungewöhnliche Datenpunkte widerspiegeln. Das folgende Diagramm der Autokorrelationsfunktion deutet auf eine starke Autokorrelation bei Lag 12 (0,76) und Lag 1 (0,948) hin. Autokorrelationen sind einfach Regressionskoeffizienten in einem Modell, in dem y die abhängige Variable ist, die durch eine Verzögerung von y vorhergesagt wird.
!
Die obige Analyse legt nahe, dass man die ersten Unterschiede der Reihe modelliert und diese „Restreihen“ untersucht, die hinsichtlich ihrer Eigenschaften mit den ersten Unterschieden identisch sind.
Diese Analyse bestätigt erneut die Idee, dass die Daten ein starkes saisonales Muster aufweisen, das durch ein Modell korrigiert oder modelliert werden könnte, das zwei unterschiedliche Operatoren enthält.
Diese einfache doppelte Differenzierung ergibt eine Menge von Residuen, auch als bereinigte Reihen oder lose als transformierte Reihen bezeichnet, die eine nicht konstante Varianz beweisen, aber der Grund für die nicht konstante Varianz ist der nicht konstante Mittelwert der Residuen Doppelt differenzierte Serien, die am Ende der Serie drei Anomalien vermuten lassen. Die Autokorrelation dieser Serie zeigt fälschlicherweise an, dass „alles in Ordnung“ ist und möglicherweise eine Ma (1) -Anpassung erforderlich ist. Vorsicht ist geboten, da es Anomalien in den Daten gibt, die dazu führen, dass der ACF nach unten verzerrt ist. Dies ist als „Alice im Wunderland-Effekt“ bekannt, dh die Annahme der Nullhypothese ohne erkennbare Struktur, wenn diese Struktur durch eine Verletzung einer der Annahmen maskiert wird.
Wir erkennen visuell drei ungewöhnliche Punkte (117,135,136)
Dieser Schritt zum Erkennen der Ausreißer wird als Interventionserkennung bezeichnet und kann nach der Arbeit von Tsay einfach oder nicht so einfach programmiert werden.
Wenn wir dem Modell drei Indikatoren hinzufügen, erhalten wir
Wir können dann schätzen
Und erhalten Sie einen Plot der Residuen und der ACF
Dies legt nahe, dass wir dem Modell möglicherweise zwei gleitende Durchschnittskoeffizienten hinzufügen. Somit könnte das nächste geschätzte Modell sein.
Nachgeben
Man könnte dann die nicht signifikante Konstante löschen und ein verfeinertes Modell erhalten:
Wir stellen fest, dass keinerlei Leistungstransformationen erforderlich waren, um eine Menge von Residuen mit konstanter Varianz zu erhalten. Beachten Sie, dass die Vorhersagen nicht explosiv sind.
Mit einer einfachen gewichteten Summe haben wir: 13 Gewichte; 3 ungleich Null und gleich (1.0.1.0., - 1.0)
Dieses Material wurde auf eine Art und Weise präsentiert, die keine automatische und folglich erforderliche Benutzerinteraktion war, um Modellierungsentscheidungen zu treffen.