Was ist eine Instrumentalvariable?


36

In der angewandten Wirtschaft und Statistik werden instrumentelle Variablen immer häufiger. Können wir für die Uneingeweihten einige nichttechnische Antworten auf die folgenden Fragen haben:

  1. Was ist eine Instrumentalvariable?
  2. Wann würde man eine instrumentelle Variable einsetzen wollen?
  3. Wie findet oder wählt man eine Instrumentalvariable?

4
Denken Sie nicht, dass der Wikipedia-Artikel dazu ausreicht?

1
Fragen wie diese erfordern eine Antwort vom Typ Wiki / Blog-Post. Ich denke, Fragen sollten nicht so lange Antworten erfordern.

Ich bin mir nicht sicher, ob es das Richtige ist, diese Frage einfach zu ignorieren und den Fragesteller an das Wiki zu verweisen - insbesondere während der Beta-Phase, in der wir versuchen, den Inhalt der Website aufzubauen. Vielleicht sollte der Fragesteller jede dieser Fragen einzeln einreichen, damit sie besser beantwortet werden können.
Russellpierce

3
@mbq - das Wikipedia-Beispiel ist kaum als nicht technisch zu bezeichnen. Es ist sehr abhängig von Jargon und Gleichungen.
Rolando2

1
Es ist in den 1980er Jahren in der Wirtschaft üblich geworden. Einige Biostatiker haben auch davon gehört und wenden es im Zusammenhang mit Messfehlermodellen an, bei denen Instrumente eng als zusätzliche verfügbare Messungen angesehen werden. Sie qualifizieren sich als Instrumente im breiteren ökonometrischen Kontext: Sie korrelieren mit der interessierenden Variablen und sie korrelieren nicht mit ihrem Messfehler.
StasK

Antworten:


41

[Das Folgende scheint aufgrund der Verwendung von Gleichungen vielleicht ein wenig technisch zu sein, baut jedoch hauptsächlich auf den Pfeiltabellen auf, um die Intuition zu vermitteln, die nur ein sehr grundlegendes Verständnis von OLS erfordert - lassen Sie sich also nicht zurückweisen.]

Angenommen, Sie möchten den kausalen Effekt von auf y i schätzen, der durch den geschätzten Koeffizienten für β gegeben ist , aber aus irgendeinem Grund besteht eine Korrelation zwischen Ihrer erklärenden Variablen und dem Fehlerterm:xiyiβ

yi=α+βxi+ϵicorr

Dies könnte geschehen sein, weil wir vergessen haben, eine wichtige Variable aufzunehmen, die auch mit korreliert . Dieses Problem wird als weggelassen Variable Bias bekannt und dann β werden Sie nicht den kausalen Effekt geben (siehe hier für die Details). Dies ist der Fall, wenn Sie ein Instrument verwenden möchten, weil Sie nur dann den wahren kausalen Effekt finden können.xiβ^

Ein Instrument ist eine neue Variable die nicht mit ϵ i korreliert, die aber gut mit x i korreliert und die nur y i bis x i beeinflusst - unser Instrument heißt also "exogen". Es ist wie in dieser Tabelle hier:ziϵixiyixi

zixiyiϵi

Wie verwenden wir diese neue Variable?
Vielleicht erinnern Sie sich an die Idee eines ANOVA-Typs hinter der Regression, bei der Sie die Gesamtvariation einer abhängigen Variablen in eine erklärte und eine unerklärte Komponente aufteilen. Wenn Sie zum Beispiel Ihr auf dem Instrument zurückführen ,xi

xitotal variation=a+πziexplained variation+ηiunexplained variation

dann wissen Sie, dass die hier erläuterte Variation unserer ursprünglichen Gleichung exogen ist, da sie nur von der exogenen Variablen abhängt . In diesem Sinne teilen wir unser x i in einen Teil auf, von dem wir behaupten können, dass er mit Sicherheit exogen ist (das ist der Teil, der von z i abhängt ), und einen unerklärten Teil η i , der alle schlechten Variationen beibehält, die mit ϵ i korrelieren . Nun nehmen wir den exogenen Teil dieser Regression, nennen es ^ x i ,zixiziηiϵixi^

xi=a+πzigood variation=x^i+ηibad variation

yi=α+βx^i+ϵi

x^iϵixiηiβxizi

ϵixiyi we took an intermediate step via x^i

x^izixiyi

Thanks to this slight diversion of our road to the causal effect we were able to consistently estimate β by using the instrument. The cost of this diversion is that instrumental variables models are generally less precise, meaning that they tend to have larger standard errors.

How do we find instruments?
That's not an easy question because you need to make a good case as to why your zi would not be correlated with ϵi - this cannot be tested formally because the true error is unobserved. The main challenge is therefore to come up with something that can be plausibly seen as exogenous such as natural disasters, policy changes, or sometimes you can even run a randomized experiment. The other answers had some very good examples for this so I won't repeat this part.


10
+1 I am grateful finally to read a detailed answer instead of a list of references or links.
whuber

1
Excellent! I explain this to my students more "mnemonically" as: x is poisoned/tainted by unobserved factors in ϵ. The first-stage regression "cleans"/sucks out the venom from x. We can use the "cleaned" version of x to find the causal coefficient, β.
MichaelChirico

Is there an intuitive argument why the 2SLS estimate for β is consistent? When we calculate x^i, we are "filtering out" the part of xi that is correlated with the error, but why should it be that the filtering out doesn't change xi in a way that changes our estimate for β?
user35734

See here: stats.stackexchange.com/questions/64279/… or you may want to ask a new question. Hope this helps.
Andy

@user35734 it's not consistent but asymptotically consistent.
Vim

17

As a medical statistician with no previous knowledge of econom(etr)ics, I struggled to get to grips with instrumental variables as I often struggled to follow their examples and didn't understand their rather different terminology (e.g. 'endogeneity', 'reduced form', 'structural equation', 'omitted variables'). Here's a few references I found useful (the first should be freely available, but I'm afraid the others probably require a subscription):

I'd also recommend chapter 4 of:



7

Non-technical (usually that's all I'm good for anyway): There are times when not only does X cause Y, but Y causes X as well. An instrumental variable is a device that can "clean up" this messy, inconvenient relationship so that the best estimates can be made of X's effect on Y.

The instrumental variable is chosen by virtue of its relationships: it is a cause of X, but, other than acting through X, it has no effect on Y. The instrument (or instruments) is used in Stage One to compute a new "version" of X, one that is in no way a function of Y. This new "predicted" X is then used in a second stage, in a more standard regression, to explain/predict Y. Hence the term Two-Stage Least Squares regression.

One typically finds the IV in processes that are overriding or beyond the control of X OR Y, such as variables that depend on laws, policies, acts of nature, etc.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.