[Das Folgende scheint aufgrund der Verwendung von Gleichungen vielleicht ein wenig technisch zu sein, baut jedoch hauptsächlich auf den Pfeiltabellen auf, um die Intuition zu vermitteln, die nur ein sehr grundlegendes Verständnis von OLS erfordert - lassen Sie sich also nicht zurückweisen.]
Angenommen, Sie möchten den kausalen Effekt von auf y i schätzen, der durch den geschätzten Koeffizienten für β gegeben ist , aber aus irgendeinem Grund besteht eine Korrelation zwischen Ihrer erklärenden Variablen und dem Fehlerterm:xiyiβ
yi=α+βxi+↖corrϵi↗
Dies könnte geschehen sein, weil wir vergessen haben, eine wichtige Variable aufzunehmen, die auch mit korreliert . Dieses Problem wird als weggelassen Variable Bias bekannt und dann β werden Sie nicht den kausalen Effekt geben (siehe hier für die Details). Dies ist der Fall, wenn Sie ein Instrument verwenden möchten, weil Sie nur dann den wahren kausalen Effekt finden können.xiβˆ
Ein Instrument ist eine neue Variable die nicht mit ϵ i korreliert, die aber gut mit x i korreliert und die nur y i bis x i beeinflusst - unser Instrument heißt also "exogen". Es ist wie in dieser Tabelle hier:ziϵixiyixi
zi→xi↑ϵi→↗yi
Wie verwenden wir diese neue Variable?
Vielleicht erinnern Sie sich an die Idee eines ANOVA-Typs hinter der Regression, bei der Sie die Gesamtvariation einer abhängigen Variablen in eine erklärte und eine unerklärte Komponente aufteilen. Wenn Sie zum Beispiel Ihr auf dem Instrument zurückführen ,xi
xitotal variation=a+πziexplained variation+ηiunexplained variation
dann wissen Sie, dass die hier erläuterte Variation unserer ursprünglichen Gleichung exogen ist, da sie nur von der exogenen Variablen abhängt . In diesem Sinne teilen wir unser x i in einen Teil auf, von dem wir behaupten können, dass er mit Sicherheit exogen ist (das ist der Teil, der von z i abhängt ), und einen unerklärten Teil η i , der alle schlechten Variationen beibehält, die mit ϵ i korrelieren . Nun nehmen wir den exogenen Teil dieser Regression, nennen es ^ x i ,zixiziηiϵixiˆ
xi=a+πzigood variation=xˆi+ηibad variation
yi=α+βxˆi+ϵi
xˆiϵixiηiβxizi
ϵixiyi we took an intermediate step via xˆi
zi→xi↗→xˆi↓yi
Thanks to this slight diversion of our road to the causal effect we were able to consistently estimate β by using the instrument. The cost of this diversion is that instrumental variables models are generally less precise, meaning that they tend to have larger standard errors.
How do we find instruments?
That's not an easy question because you need to make a good case as to why your zi would not be correlated with ϵi - this cannot be tested formally because the true error is unobserved. The main challenge is therefore to come up with something that can be plausibly seen as exogenous such as natural disasters, policy changes, or sometimes you can even run a randomized experiment. The other answers had some very good examples for this so I won't repeat this part.