Einbeziehung der verzögerten abhängigen Variablen in die Regression


26

Ich bin sehr verwirrt darüber, ob es legitim ist, eine verzögerte abhängige Variable in ein Regressionsmodell aufzunehmen. Grundsätzlich denke ich, wenn sich dieses Modell auf die Beziehung zwischen der Änderung von Y und anderen unabhängigen Variablen konzentriert, kann das Hinzufügen einer verzögerten abhängigen Variablen auf der rechten Seite sicherstellen, dass der Koeffizient vor anderen IVs unabhängig vom vorherigen Wert von Y ist.

Einige sagen, dass die Einbeziehung von LDV den Koeffizienten anderer IVs nach unten drückt. Einige andere sagen, dass man LDV einschließen kann, was die serielle Korrelation verringern kann.

Ich weiß, dass diese Frage in Bezug auf die Art der Regression ziemlich allgemein ist. Mein statistisches Wissen ist jedoch begrenzt, und es fällt mir wirklich schwer, herauszufinden, ob ich eine verzögerte abhängige Variable in ein Regressionsmodell einbeziehen sollte, wenn der Fokus auf der Änderung von Y im Zeitverlauf liegt.

Gibt es andere Ansätze, um mit dem Einfluss von Xs auf die Änderung von Y über die Zeit umzugehen? Ich habe auch verschiedene Änderungswerte als DV ausprobiert, aber das R-Quadrat in dieser Situation ist sehr niedrig.


1
Was hoffen Sie mit Ihrem Modell zu erreichen? Das Maximieren von R-Quadrat ist selten ein gutes Modellauswahlkriterium.
Michael Bishop

Dieses Modell wird zur Vorhersage verwendet. Es ist wahr, dass, obwohl sich das R-Quadrat stark unterscheidet, die vorhergesagten Werte unter Verwendung von Y oder der Änderung von Y tatsächlich die gleichen sind aktuelle Gruppe von IVs ist nicht in der Lage, die Änderung sehr gut zu erklären und es müssen einige Variablen weggelassen werden?
user22109

Antworten:


19

Die Entscheidung, eine verzögerte abhängige Variable in Ihr Modell aufzunehmen, ist wirklich eine theoretische Frage. Es ist sinnvoll, einen verzögerten DV einzuschließen, wenn Sie erwarten, dass der aktuelle Pegel des DV stark vom vorherigen Pegel abhängt. In diesem Fall führt das Nichteinbeziehen des verzögerten DV zu einer fehlenden variablen Verzerrung, und Ihre Ergebnisse sind möglicherweise unzuverlässig. In einem solchen Szenario, einschließlich des verzögerten DV, wird ein Großteil Ihrer Varianz beeinträchtigt, und die Auswirkungen Ihres anderen DV werden wahrscheinlich weniger bedeutend (was bedeutet, dass sowohl die Werte kleiner als auch die Standardfehler größer werden). Sie können jedoch sagen, dass die IVs, die Ihr Ergebnis noch beeinflussen, einen Einfluss auf den vergangenen DV-Wert haben. Ein alternativer Ansatz besteht darin, die Differenz zwischen Ihrer Ergebnisvariablen zum Zeitpunktβtund als DV für die Periode .t-1t

t-1t-2


12

Ich empfehle zwei Artikel:

  1. Achen CH (2001) Warum verzögerte abhängige Variablen die Erklärungskraft anderer unabhängiger Variablen unterdrücken können ( Link )
  2. Keele, L. und Kelly NJ (2005) Dynamische Modelle für dynamische Theorien: die Vor- und Nachteile verzögerter abhängiger Variablen ( Link ).

Das Ergebnis ist, dass das Einbeziehen einer verzögerten abhängigen Variablen einen großen Einfluss auf die Koeffizienten der verbleibenden Variablen haben kann. Manchmal ist dies angemessen (für die Dynamic-Modelle von Keele und Kelly) und manchmal nicht. Wie andere gesagt haben, ist es wichtig, über den zu modellierenden Prozess nachzudenken.


4

Das Einbeziehen verzögerter abhängiger Variablen kann das Auftreten von Autokorrelation aufgrund von Modellfehlspezifikationen verringern. Die Berücksichtigung verzögerter abhängiger Variablen hilft Ihnen somit, die Existenz einer Autokorrelation im Modell zu verteidigen. Der Wert in der Vergangenheit wirkt sich auf die Gegenwart im Modell aus, erfordert eine theoretische Grundlage und passt das Modell nach Bedarf an.


Ich bin mir nicht sicher, ob ich dem letzten Satz gerecht wurde. Bitte editieren, wenn die Bedeutung geklärt werden kann. Willkommen bei Cross Validated BTW!
Nick Stauner

1
Autokorrelation kann ein Artefakt bei der Datenerfassung sein. Ich erhielt Daten durch Digitalisieren eines Diagramms, was bedeutete, dass die Daten sortiert waren. Diese Sortierung und die nichtlineare Beziehung verursachten eine Autokorrelation in den Residuen.
Tony Ladson

2

Was mich an dieser Frage fasziniert, ist, dass ich nicht mehr über die Spezifikation des Modells oder die Schätztechnik dafür Bescheid weiß. Ich erwähne, dass, obwohl die Verwendung eines verzögerten DV unter den IVs theoretisch wichtig und methodisch notwendig sein kann, dies in Abhängigkeit von der wesentlichen Beziehung zwischen Variablen und Zeiteinheiten und auch von der AR auch eine riskante Menge an Endogenität in das Modell einbringen kann Reihenfolge, die im Modell vorhanden sein kann. Wenn Sie (und wir) nicht mehr Details zu den Variablen und zur Schätzung haben, würde ich es nicht als angenehm empfinden, die Verzögerung des DV zu empfehlen, es sei denn, Sie denken an eine instrumentelle Variablentechnik oder so etwas wie die Arellano-Bond-Schätzung.

Bitte geben Sie uns weitere Details, damit wir besser wissen, um welche Art von Modell es sich handelt.


0

Ja, Sie sollten Nickell-Vorurteile in einer kleinen T-Large-N-Situation im Auge behalten (Nickell, S. (1981). Vorurteile in dynamischen Modellen mit festen Effekten. Econometrica: Journal of the Econometric Society, 1417-1426.)

Möglicherweise möchten Sie sich Dynamic Panel Data-Modelle wie Arellano-Bond- oder Blundell-Bond-Schätzer ansehen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.