Es gab eine ähnliche Frage bezüglich einer Probit-ersten Stufe und einer OLS-zweiten Stufe. In der Antwort habe ich einen Link zu Notizen bereitgestellt, die einen formalen Beweis für die Inkonsistenz dieser Regression enthalten, die formal als "verbotene Regression" bekannt ist, wie sie von Jerry Hausman genannt wurde. Der Hauptgrund für die Inkonsistenz des Ansatzes Probit First Stage / OLS Second Stage besteht darin, dass weder der Erwartungsoperator noch der Operator für lineare Projektionen eine nichtlineare erste Stufe durchlaufen. Daher sind die angepassten Werte aus einem Probit der ersten Stufe nur unter sehr restriktiven Annahmen, die in der Praxis so gut wie nie gelten, nicht mit dem Fehlerterm der zweiten Stufe korreliert. Beachten Sie jedoch, dass der formale Beweis für die Inkonsistenz der verbotenen Regression ziemlich ausführlich ist, wenn ich mich richtig erinnere.
Wenn Sie ein Modell
bei dem ein kontinuierliches Ergebnis und eine binäre endogene Variable ist, können Sie die erste Stufe
über OLS und verwenden Sie in der zweiten Stufe die angepassten Werte anstelle von . Dies ist das lineare Wahrscheinlichkeitsmodell, auf das Sie sich bezogen haben. Da es für diese lineare erste Stufe kein Problem mit Erwartungen oder linearen Projektionen gibt, sind Ihre 2SLS-Schätzungen konsistent, wenn auch weniger effizient als sie sein könnten, wenn wir die nichtlineare Natur von berücksichtigen würden .
Yi=α+βXi+ϵi
YiXiXi=a+Z′iπ+ηi
XˆiXiXi
Die Konsistenz dieses Ansatzes beruht auf der Tatsache, dass ein nichtlineares Modell zwar besser zu den bedingten Erwartungsfunktionen für begrenzte abhängige Variablen passt, dies jedoch keine große Rolle spielt, wenn Sie an dem Randeffekt interessiert sind. Im linearen Wahrscheinlichkeitsmodell sind die Koeffizienten selbst Randeffekte, die am Mittelwert bewertet werden. Wenn also der Randeffekt am Mittelwert das ist, wonach Sie suchen (und normalerweise Menschen sind), dann ist dies das, was Sie wollen, da das lineare Modell die beste lineare ergibt Annäherungen an nichtlineare bedingte Erwartungsfunktionen.
Gleiches gilt, wenn binär ist.Yi
Weitere Informationen hierzu finden Sie in den hervorragenden Vorlesungsunterlagen von Kit Baum zu diesem Thema. Ab Folie 7 diskutiert er die Verwendung des linearen Wahrscheinlichkeitsmodells im 2SLS-Kontext.
Wenn Sie Probit wirklich verwenden möchten, weil Sie effizientere Schätzungen wünschen, gibt es einen anderen Weg, der auch in Wooldridge (2010) "Ökonometrische Analyse von Querschnitts- und Paneldaten" erwähnt wird. Die oben verlinkte Antwort enthält sie, ich wiederhole sie hier der Vollständigkeit halber. Als angewandtes Beispiel siehe Adams et al. (2009) , die ein dreistufiges Verfahren anwenden, das wie folgt aussieht:
- Verwenden Sie probit, um die endogene Variable auf dem Instrument (den Instrumenten) und die exogenen Variablen zu regressieren
- Verwenden Sie die vorhergesagten Werte aus dem vorherigen Schritt in einer ersten OLS-Stufe zusammen mit den exogenen (aber ohne instrumentelle) Variablen
- mache die zweite Stufe wie gewohnt
Dieses Verfahren fällt nicht auf das verbotene Regressionsproblem, sondern liefert möglicherweise effizientere Schätzungen Ihres interessierenden Parameters.