Die Antwort von JohnRos ist sehr gut. Im Klartext bedeutet Endogenität, dass Sie die Ursache falsch verstanden haben. Dass das Modell, das Sie aufgeschrieben und geschätzt haben, die Wirkungsweise der Kausalität in der realen Welt nicht richtig erfasst. Wenn du schreibst:
Yi=β0+β1Xi+ϵi
Sie können sich diese Gleichung auf verschiedene Arten vorstellen. Sie können sich dies als eine bequeme Methode vorstellen, um basierend auf den -Werten vorherzusagen . Sie können sich dies als eine bequeme Methode zur Modellierung von . In beiden Fällen gibt es keine Endogenität, und Sie müssen sich darüber keine Sorgen machen.X E { Y | X }YXE{Y|X}
Sie können sich die Gleichung jedoch auch als Verkörperung der Kausalität vorstellen. Sie können sich als Antwort auf die Frage : "Was würde mit geschehen, wenn ich in dieses System eingreifen und experimentell um 1 erhöhen würde ?" Wenn Sie so darüber nachdenken möchten, müssen Sie bei der Schätzung von OLS davon ausgehen, dass: Y Xβ1YX
- YX verursachtY
- Yϵ verursachtY
- Xϵ verursacht keinX
- XY verursacht keinX
- Nichts, was verursacht, verursacht auchXϵX
Ein Ausfall von 5 führt im Allgemeinen zu oder, nicht ganz gleichbedeutend, zu . Instrumentelle Variablen sind eine Möglichkeit, die Tatsache zu korrigieren, dass Sie die Ursache falsch verstanden haben (indem Sie eine andere, andere, kausale Annahme treffen). Eine perfekt durchgeführte, randomisierte, kontrollierte Studie ist ein Weg , 3-5 zur Wahrheit zu zwingen . Wenn Sie Zufallsprinzip auswählen , wird es nicht durch , oder irgendetwas anderes verursacht. Sogenannte "Natural Experiment" -Methoden sind Versuche, besondere Umstände in der Welt herauszufinden, in denen 3-5 wahr sind, selbst wenn wir nicht glauben, dass 3-5 normalerweise wahr sind.C o v ( X , ≤ ) ≤ 0 X Y ≤E{ϵ|X}≠0Cov(X,ϵ)≠0XYϵ
In JohnRos 'Beispiel benötigen Sie zur Berechnung des Lohnwerts von Bildung eine kausale Interpretation von , aber es gibt gute Gründe zu glauben, dass 3 oder 5 falsch sind.β1
Ihre Verwirrung ist jedoch verständlich. In Kursen nach dem linearen Modell ist es sehr typisch, dass der Kursleiter die kausale Interpretation von ich oben angegeben habe, während er vorgibt, keine Kausalität einzuführen, und vorgibt, dass "alles nur Statistik ist". Es ist eine feige Lüge, aber es ist auch sehr verbreitet. β1
Tatsächlich ist es Teil eines größeren Phänomens in der Biomedizin und den Sozialwissenschaften. Es ist fast immer so, dass wir versuchen, die kausale Wirkung von auf zu bestimmen - darum geht es doch in der Wissenschaft. Andererseits gibt es auch fast immer eine Geschichte, die zu dem Schluss führt, dass eine von 3-5 falsch ist. Es gibt also eine Art von praktizierter, fließender, uneindeutiger Unehrlichkeit, in der wir Einwände austauschen, indem wir sagen, dass wir nur Assoziationsarbeit leisten und dann die kausale Interpretation an anderer Stelle zurückschleichen (normalerweise in den Abschnitten Einleitung und Schlussfolgerung des Papiers).YXY
Wenn Sie wirklich interessiert sind, sollten Sie Judea Perl lesen . James Heckman ist auch gut.
R
.