Warum einen verzögerten DV als Instrumentenvariable verwenden?

12

Ich habe einen Datenanalysecode geerbt, den ich als Ökonometriker nur schwer verstehen kann. Ein Modell führt eine Regression instrumenteller Variablen mit dem folgenden Befehl Stata aus

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

Dieser Datensatz ist ein Panel mit mehreren aufeinander folgenden Beobachtungen für diesen Satz von Variablen.

Warum verwendet dieser Code die verzögerten Werte des DV als Instrumente? So wie ich es verstehe (aus dem Eingraben in ein altes Lehrbuch), wird die IV-Schätzung verwendet, wenn ein Problem vorliegt, weil ein Regressor mit dem Fehlerterm korreliert. Es wird jedoch nichts darüber erwähnt, Verzögerungen des DV als Instrumente zu wählen.

Ein Kommentar in dieser Zeile des Codes erwähnt "Kausalität". Jede Hilfe, um herauszufinden, was hier das Ziel war, wäre sehr willkommen.

regression stata instrumental-variables

— Laramichaels
quelle

Aufgrund Ihrer Frage lesen Sie den Code möglicherweise etwas falsch. Die Syntax verwendet die Unterschiede als "Instrumente", um die Verzögerung der abhängigen Variablen abzuschätzen.

— Andy W

lara: könntest du deine frage bearbeiten, um die bedeutung des abgeschnittenen stata-Codes klar zu erklären?

— user603

7

Bearbeiten: Angesichts der Klarstellung des von Andy W unten bereitgestellten Statistikcodes habe ich meine Antwort geändert, um die Frage besser beantworten zu können. Die alte Version meiner Antwort finden Sie unter der aktuellen.

Es scheint, dass Ihr Code ein ungeschickter Versuch ist, den Arellano-Bond-Schätzer selbst zu erstellen (unter der Annahme von ivreg-Schätzungen mit 2SOLS). Weitere Details zur Verwendung und Logik des A / B-Schätzers finden Sie in diesem schönen Übersichtsartikel sowie in dieser breiteren Einführung.

Kurz gesagt und innerhalb von drei Zeilen: Obwohl der A / B-Schätzer tatsächlich ein (verallgemeinerter) IV-Schätzer ist, wird er nicht verwendet, um ein Problem der Kausalität anzugehen. Die IVs werden in diesem Zusammenhang verwendet, um eine effiziente Schätzung des AR-Koeffizienten im Kontext von Paneldaten bereitzustellen.

Ich würde empfehlen, das Rad hier nicht neu zu erfinden und stattdessen eine vorgefertigte Toolbox zu verwenden, um solche Schätzungen durchzuführen. Für Daten können Sie das Paket XTABOND2 (oder XTABOND, wenn Sie STAT11 ausführen) verwenden.

alte Antwort:

$x_t$ $y_t$ $x_t$ $y_t$ $x_t$ $y_t$ $y_t$ $x_t$

$y_t$ $x_{t-1}$ $x_t$

$y_t\leftarrow x_{t-1}$ $x_{t-1} \leftarrow y_{t}$ $x$ $y$

$y_t$ $x_{t-1}$ $I(0)$

— user603
quelle

+1 Stimmen Sie dieser Interpretation zu, dass sie wie DIY Arellano-Bond aussieht. NB: Ich habe festgestellt, dass Arellano-Bond nur dann vertrauenswürdig ist, wenn die Anzahl der Querschnittseinheiten sehr groß ist - wie in vielen Hunderten. Arellano weist in seinen Artikeln und seinem Lehrbuch darauf hin, dass die Konsistenz in der Anzahl der Querschnittseinheiten liegt und die Konvergenzrate nicht allzu schnell ist.

— Cyrus S

5

Ich kenne Stata nicht, daher kann ich das spezifische Modell nicht kommentieren. Die Verwendung von verzögerten Variablen ist jedoch ein ziemlich häufiger Ansatz, wenn es um Gleichzeitigkeitsverzerrungen im Allgemeinen und die Erstellung instrumenteller Variablen im Besonderen geht.

Angenommen, Sie haben eine Rückmeldung zwischen zwei Variablen in Ihrem Modell: der unabhängigen Variablen (z. B. Preis) und der abhängigen Variablen (z. B. Menge). Dann sind beide endogen (ihre Ursachen ergeben sich aus dem Modell) und Störungen des Fehlerterms wirken sich auf beide Variablen aus.

Um dies zu lösen, möchten Sie die unabhängige Variable (Preis) exogen machen, sodass Störungen im Fehler nur die abhängige Variable (Menge) betreffen. Dies wird erreicht, indem neue exogene Variablen erstellt werden, indem die anderen exogenen Variablen in Ihrem Modell auf den Preis zurückgeführt werden. Diese neuen exogenen Variablen sind Ihre instrumentellen Variablen (IVs). Die IVs werden von exogenen Begriffen abgeleitet und sind daher nicht mit dem Fehler korreliert.

Dazu müssen Sie jedoch herausfinden, welche Variablen exogen sind, damit sie zur Ableitung der IVs verwendet werden können. Wir können feststellen, dass verzögerte Variablen in der Vergangenheit "aufgetreten" sind und daher nicht mit dem Fehler in der Gegenwart korreliert werden können. Verzögerte Variablen sind daher exogen und werden zu geeigneten Kandidaten für die Ableitung von IVs. (Beachten Sie jedoch, dass das vorhergehende Argument fehlschlägt, wenn die Fehler automatisch korreliert werden.)

Eine gute Einführung und ein Hinweis darauf ist die einführende Ökonometrie: ein moderner Ansatz von Wooldridge.

— ars
quelle

5

Für diejenigen, die mit dem folgenden Code-Snippet von Stata nicht vertraut sind, wird das OP bereitgestellt

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

Diese Gleichung kann gelesen werden als

$Y_t = \alpha + \beta_1 (Var1) + \beta_2 (Var1) + \beta_3 (Var1) + \beta_4 (\tilde{Y}_{t-1})$

$\tilde{Y}_{t-1}$

$\tilde{Y}_{t-1} = \alpha + Z_1(\Delta^{2}Y_t) + Z_2(\Delta^{3}Y_t) + Z_3(\Delta^{4}Y_t)$

(dh die erste Stufe der IV-Gleichung befindet sich in der Klammer im Stata-Code)

Die Deltas stellen Unterschiede zweiter, dritter und vierter Ordnung dar und werden als ausgeschlossene Instrumente verwendet, um die Verzögerung der abhängigen Variablen abzuschätzen.

L. $t-1$ D.D2.

Anfangs konnte ich mir keine logischen Gründe vorstellen, warum jemand dies tun würde. Kwak wies jedoch (unter Bezugnahme auf dieses Papier ) darauf hin, dass die Arellano-Bond-Methode die Unterschiede als Instrumente zur Schätzung der autoregressiven Komponente des Modells verwendet. (Auch ursprünglich hatte ich angenommen, dass die Unterschiede nur dann eine Auswirkung haben würden, wenn die Serie nicht stationär ist. Bond gibt in diesem verknüpften Papier an, dass die Unterschiede nur schwache Instrumente sind, wenn es sich bei der Serie um einen zufälligen Spaziergang handelt (S. 21) )

Als Vorschläge für weiteres Lesematerial als Einführung in instrumentelle Variablen,

Ein weiteres Poster in dieser Antwort (Charlie), das mit einigen Folien verknüpft ist, die er vorbereitet hat und die mir gefallen und die ich vorschlagen würde, ist eine Einführung in instrumentelle Variablen wert. Ich würde diesen Powerpoint auch einem Professor vorschlagen, der sich als Einführung auf einen Workshop vorbereitet hat. Als letzten Vorschlag für alle, die mehr über instrumentelle Variablen erfahren möchten, sollten Sie die Arbeit von Joshua Angrist nachschlagen.

Hier ist meine erste Antwort

L. $t-1$ D.D2.

In allen Anwendungen, die ich gesehen habe, verwenden Menschen die Verzögerung unabhängiger Variablen als Instrumente, um die Verzögerung der abhängigen Variablen abzuschätzen (aus Gründen, über die ars spricht). Dies basiert jedoch auf der Annahme, dass die verzögerten unabhängigen Variablen in dem Zeitraum, in dem sie angewendet werden, für den Fehlerterm exogen sind.

Ich kenne keine Argumentation, bei der die Unterschiede der abhängigen Variablen als exogen angesehen würden. Soweit mir bekannt ist, ist es nicht üblich, nur eine Seite der Gleichung zu unterscheiden, und würde zu eher unlogischen Ergebnissen führen ( hier ist ein Artikel, der jemanden über die umgekehrte Situation kritisiert, in der er eine Variablenebene als Prädiktor für eingeschlossen hat eine differenzierte Reihe.) Wenn Sie die Begriffe in der IV-Gleichung neu anordnen, ähnelt sie tatsächlich einem erweiterten Dickey-Fuller-Test.

Während die einfachste Antwort darin besteht, die Person zu fragen, die den Code geschrieben hat, kann jemand ein Beispiel nennen, in dem dieses Verfahren akzeptabel wäre, oder eine Situation, in der dieses Verfahren einige aussagekräftige Ergebnisse liefern würde? Ich kann mir keine logische Begründung vorstellen, warum sich die Unterschiede auf die Ebenen auswirken würden, außer in dem Fall, dass die Serie nicht stationär ist.

— Andy W.
quelle

Hallo Andy. Ich kenne keinen Statistikcode. Deshalb erwähne ich nicht den Code, der in meiner Antwort enthalten ist und der als Antwort auf den Teil der Frage verstanden werden muss, der auf Englisch formuliert ist.

— user603

@kwak - Ich habe Ihren Beitrag nicht kritisiert, ich stimme allem zu, was Sie gesagt haben. Ich habe mich nur gefragt, ob es eine Logik gibt, warum jemand die Unterschiede als Instrumente verwenden würde, von denen ich nichts wusste. Ich kann mir keine Situation vorstellen, in der die Unterschiede eine der Anforderungen für ein solches Verfahren erfüllen würden.

— Andy W

Hallo Andy:> Ich habe deinen Kommentar nicht als Kritiker verstanden. Ihr Beitrag hebt einen Schlüsselaspekt der Frage hervor, den weder Rob noch ich (zugegebenermaßen) verstanden haben. Wenn überhaupt, zeigt es die Bedeutung der Zusammenarbeit.

— user603

+1. Ich habe das alles nicht früher gesehen - Vielen Dank, dass Sie das Problem sowie den Crash- / Minikurs zur Statistiknotation zur Kenntnis genommen haben. Ich habe Ihren ersten Kommentar genommen, um zu implizieren, dass die Interpretation falsch war und in einem sehr allgemeinen Sinne beantwortet wurde. Ich bin froh, dass du hartnäckiger warst und dass Kwak es herausgefunden hat.

— Ars