Verwechslung mit Augmented Dickey Fuller Test


16

Ich arbeite an dem electricityim R-Paket verfügbaren Datensatz TSA. Mein Ziel ist es, herauszufinden, ob ein arimaModell für diese Daten geeignet ist, und es schließlich anzupassen. Also ging ich wie folgt vor:

1. Zeichne die Zeitreihen auf, die sich aus der folgenden Grafik ergeben: ts plot1

2. Ich wollte ein Logbuch electricityzur Stabilisierung der Varianz erstellen und danach die Reihe entsprechend differenzieren, habe aber kurz zuvor die Stationarität auf der getestet Originaldatensatz unter Verwendung des adf(Augmented Dickey Fuller) -Tests und überraschenderweise wie folgt:

Code und Ergebnisse:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

Nun, nach der Vorstellung meines Anfängers von Zeitreihen bedeutet dies, dass die Daten stationär sind (kleiner p-Wert, Nullhypothese der Nichtstationarität ablehnen). Aber wenn ich mir die Handlung anschaue, finde ich keine Möglichkeit, dass dies stationär sein kann. Hat jemand eine gültige Erklärung dafür?


5
Der ADF prüft nur, ob die Wurzel stationär ist. Dies kann ein stationärer Trend sein. Verwenden Sie daher den KPSS-Test (siehe stats.stackexchange.com/questions/30569/…). Im Allgemeinen gibt es einen Unterschied zwischen DS-Modellen (Differenz-Stationär) und TS-Modellen (Trend-Stationär). KPSS ist der bessere Test, um zwischen diesen Modellen zu unterscheiden. Weitere Informationen finden Sie im Link.
Statistiker

3
Sieht aus wie die Serie hat Saisonale und Trend. Integrieren Sie einen deterministischen Trend + saisonale Dummies in den ADF-Test und führen Sie den Test durch. Überprüfen Sie auch auf autokorrelierte Residuen.
Pantera

Antworten:


12

Da Sie den Standardwert von k in annehmen adf.test, der in diesem Fall 7 ist, testen Sie im Grunde genommen, ob der Informationssatz der letzten 7 Monate zur Erklärung von beiträgt . Der Stromverbrauch weist eine starke Saisonabhängigkeit auf, wie Ihr Grundstück zeigt, und dürfte über einen Zeitraum von sieben Monaten hinaus zyklisch sein. Wenn Sie k = 12 setzen und erneut testen, kann die Null der Einheitswurzel nicht verworfen werden.xt-xt-1

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary

2

Unter der Annahme, dass "adf.test" tatsächlich aus dem Paket "tseries" stammt (direkt oder indirekt), liegt der Grund darin, dass es automatisch einen linearen Zeittrend enthält. Aus der tseries doc (Version 0.10-35): "Es wird die allgemeine Regressionsgleichung verwendet, die einen konstanten und einen linearen Trend enthält."

Ich stimme auch Pantera zu, dass die saisonalen Effekte das Ergebnis verfälschen könnten. Die Serie könnte in Wirklichkeit ein Zeittrend + deterministische Saisonale + stochastischer Einheitswurzelprozess sein, aber der ADF-Test könnte die saisonalen Schwankungen als stochastische Umkehrung des deterministischen Trends interpretieren, was bedeuten würde, dass die Wurzeln kleiner als eins sind. (Wenn Sie jedoch genügend Verzögerungen berücksichtigt haben, sollte dies eher als (unechte) Einheitswurzel bei saisonalen Frequenzen angezeigt werden, nicht bei der Null- / Langzeitfrequenz, auf die sich der ADF-Test bezieht Saisonmuster ist es besser, die Saisonzeiten einzuschließen.)

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.