Was ist mit Erklärungen in Zeitreihen zu tun?


11

Nachdem ich bisher hauptsächlich mit Querschnittsdaten gearbeitet habe und erst kürzlich beim Durchsuchen gestolpert bin und durch eine Reihe einführender Zeitreihenliteratur gestolpert bin, frage ich mich, welche Rolle erklärende Variablen bei der Zeitreihenanalyse spielen.

Ich möchte einen Trend erklären, anstatt den Trend zu verringern. Das meiste, was ich als Einführung gelesen habe, geht davon aus, dass die Serie aus einem stochastischen Prozess stammt. Ich habe über AR (p) - und MA-Prozesse sowie über die ARIMA-Modellierung gelesen. Da ich mehr Informationen als nur autoregressive Prozesse verarbeiten wollte, fand ich VAR / VECM und führte einige Beispiele aus, aber ich frage mich immer noch, ob es einen Fall gibt, der näher mit dem zusammenhängt, was Erklärungen in Querschnitten tun.

Die Motivation dahinter ist, dass die Zerlegung meiner Serie zeigt, dass der Trend den Hauptbeitrag leistet, während der Rest und der saisonale Effekt kaum eine Rolle spielen. Ich möchte diesen Trend erklären.

Kann / sollte ich meine Serie auf mehrere verschiedene Serien zurückführen? Intuitiv würde ich wegen der seriellen Korrelation gls verwenden (ich bin mir über die Cor-Struktur nicht so sicher). Ich habe von falscher Regression gehört und verstehe, dass dies eine Falle ist, aber ich suche nach einer Möglichkeit, einen Trend zu erklären.

Ist das völlig falsch oder ungewöhnlich? Oder habe ich bisher nur das richtige Kapitel verpasst?

Antworten:


15

Basierend auf den Kommentaren, die Sie zu den Antworten angeboten haben, müssen Sie sich der falschen Ursache bewusst sein . Jede Variable mit einem Zeittrend wird mit einer anderen Variablen korreliert, die ebenfalls einen Zeittrend aufweist. Zum Beispiel mein Gewicht von der Geburt bis zum Alter von 27 Jahren wird 27. Offensichtlich mit Ihrem Gewicht von Geburt bis zum Alter stark korreliert sein, wird mein Gewicht nicht verursacht durch Ihr Gewicht. Wenn ja, würde ich Sie bitten, öfter ins Fitnessstudio zu gehen.

Da Sie mit Querschnittsdaten vertraut sind, werde ich Ihnen eine Erklärung für ausgelassene Variablen geben. Lass mein Gewicht und dein Gewicht , wobei xtyt

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

Dann hat die Regression eine ausgelassene Variable - den -, die mit der enthaltenen Variablen korreliert . Daher wird der Koeffizient vorgespannt (in diesem Fall ist er positiv, wenn unsere Gewichte mit der Zeit wachsen).

yt=γ0+γ1xt+νt
xtγ1

Wenn Sie eine Zeitreihenanalyse durchführen, müssen Sie sicherstellen, dass Ihre Variablen stationär sind, sonst erhalten Sie diese falschen Kausalergebnisse. Eine Ausnahme wären integrierte Serien, aber ich würde Sie auf Zeitreihentexte verweisen, um mehr darüber zu erfahren.


5
+1 zum Beispiel für falsche Regression. Wird es in den Vorlesungen einsetzen :)
mpiktas

1
Eh, du gehst ins Fitnessstudio, um Gewicht zu verlieren? :)
hans0l0

6

Die gleiche Intuition wie bei der Querschnittsregression kann bei der Zeitreihenregression verwendet werden. Es ist durchaus sinnvoll zu versuchen, den Trend mit anderen Variablen zu erklären. Der Hauptunterschied besteht darin, dass implizit angenommen wird, dass die Regressoren Zufallsvariablen sind. Also im Regressionsmodell:

Yt=β0+Xt1β1+...+Xtkβk+εt

wir benötigen anstelle von und anstelle von .E ε t = 0 E ( ε 2 t | X t 1 , . . . , X t k ) = σ 2 E ε 2 t = σ 2E(εt|Xt1,...,Xtk)=0Eεt=0E(εt2|Xt1,...,Xtk)=σ2Eεt2=σ2

Der praktische Teil der Regression bleibt gleich, es gelten alle üblichen Statistiken und Methoden.

Der schwierige Teil ist zu zeigen, für welche Arten von Zufallsvariablen oder in diesen Fällen stochastische Prozesse wir klassische Methoden verwenden können. Der übliche zentrale Grenzwertsatz kann nicht angewendet werden, da er unabhängige Zufallsvariablen beinhaltet. Zeitreihenprozesse sind normalerweise nicht unabhängig. Hier kommt die Bedeutung der Stationarität ins Spiel. Es wird gezeigt, dass für einen großen Teil der stationären Prozesse der zentrale Grenzwertsatz angewendet werden kann, sodass die klassische Regressionsanalyse angewendet werden kann.Xtk

Die wichtigste Einschränkung der Zeitreihenregression besteht darin, dass sie massiv versagen kann, wenn die Regressoren nicht stationär sind. Dann können übliche Regressionsmethoden zeigen, dass der Trend erklärt wird, obwohl dies nicht der Fall ist. Wenn Sie also den Trend erklären möchten, müssen Sie prüfen, ob er nicht stationär ist, bevor Sie fortfahren. Andernfalls könnten Sie zu falschen Schlussfolgerungen gelangen.


1
Danke für Ihre Geduld. Dennoch könnte das BIP eine mögliche Erklärung für meine Variable sein. Wahrscheinlich verwende ich Wachstumsraten besser, weil es sonst hier nur einen Zeittrend darstellt. Der Grund, warum ich eine Regression verwenden möchte, ist, dass ich daran interessiert bin, das zu extrahieren, was eigentlich NICHT durch Zeittrendvariablen wie das BIP erklärt wird.
hans0l0

1
@ ran2, es ist immer am besten, das BIP-Wachstum anstelle seines realen Wertes zu verwenden. Beachten Sie, dass die Regressionsanalyse Ihnen auch sagen kann, welche Variablen den Trend nicht erklären, sodass Sie möglicherweise das Ergebnis haben, dass es keine Variablen gibt, die Ihren Trend erklären können (oder dass die Variablen, an die Sie gedacht haben, den Trend nicht erklären).
mpiktas

1
@raegtin, stationäre Prozesse, die zum Beispiel keine zweiten Momente haben.
mpiktas

1
Das einzige, was ich hinzufügen möchte, ist, vorsichtig mit der Verwendung der Welt "erklären" zu sein. Einige Rezensenten werden dies nicht mögen.
Jase

1
@Jase, nun, ich habe den Begriff in einem Sinne verwendet, den das OP gefragt hat, dh eine aussagekräftige statistische Beziehung gefunden.
mpiktas

3

Wenn Sie unterstützende / kausale / helfende / rechte / exogene / Prädiktor-Reihen haben, ist der bevorzugte Ansatz die Erstellung einer Übertragungsfunktion mit einer einzigen Gleichung und mehreren Eingaben. Man muss mögliche Modellreste sowohl für nicht spezifizierte / ausgelassene deterministische Eingaben untersuchen, dh für die Interventionserkennung ala Ruey Tsay 1988 Journal of Forecasting als auch für nicht spezifizierte stochastische Eingaben über eine ARIMA-Komponente. Somit können Sie nicht nur die vom Benutzer vorgeschlagenen Kausale (und alle erforderlichen Verzögerungen!) Explizit einbeziehen, sondern auch zwei Arten von ausgelassenen Strukturen (Dummies und ARIMA).

Es sollte darauf geachtet werden, dass sich die Parameter des endgültigen Modells im Laufe der Zeit nicht wesentlich ändern, da sonst die Datensegmentierung möglicherweise in Ordnung ist und nicht nachgewiesen werden kann, dass die Residuen des endgültigen Modells eine heterogene Varianz aufweisen.

Der Trend in der ursprünglichen Reihe kann auf Trends in der Prädiktorserie oder auf autoregressive Dynamik in der interessierenden Reihe oder möglicherweise auf eine ausgelassene deterministische Reihe zurückzuführen sein, die durch eine stationäre Konstante oder sogar einen oder mehrere lokale Zeittrends ersetzt wird.


0

Aus weniger technischer Sicht ist es oft nicht sehr hilfreich, nur den Trend zu erklären. das heißt, die Zeit als Prädiktor von primärem Interesse zu behandeln. Die Variation einer Reihe über die Zeit impliziert häufig die zugrunde liegenden Effekte anderer Variablen, einschließlich autoregressiver und / oder exogener Prozesse, was für die Untersuchung konzeptionell relevanter ist. Daraus folgt, dass, wenn diese Variablen auch über die Zeit variieren, die Kontrolle des Zeiteffekts tatsächlich erforderlich ist, um nicht in die künstlich signifikante Beziehung zu fallen, wie @mpiktas gezeigt hat.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.