Nehmen wir an, ich habe Querschnittsdaten zu , , (siehe unten für , , ).
Ich möchte die Auswirkung der Variablen und und ihre Wechselwirkung ( ) auf die Variable Verwendung des Kontrollfunktionsansatzes abschätzen , und höchstwahrscheinlich sind und endogen. Ich habe zwei Instrumente, und . Ich schätze die folgenden zwei Gleichungen der ersten Stufe und speichere die vorhergesagten Residuen folgendermaßen:
ivreg2 x1 z1 z2
predict error1hat, residuals
ivreg2 x2 z1 z2
predict error2hat, residuals
Sobald ich die vorhergesagten Residuen gespeichert habe, schätze ich die Gleichung der zweiten Stufe folgendermaßen:
ivreg2 y x1 x2 x3 error1hat error2hat
Obwohl die geschätzten Koeffizienten von , und sinnvoll sind, weiß ich, dass die Standardfehler nicht in Ordnung sind (siehe Seite 8 von http://eml.berkeley.edu/~train/petrintrain.pdf ).
Auf Seite 8 von http://eml.berkeley.edu/~train/petrintrain.pdf schlagen die Autoren vor, den Bootstrap zu verwenden, um korrigierte Standardfehler für , und .
Meine Fragen sind :
- Wie soll ich den Bootstrap einrichten?
- Wird der Bootstrap nur auf die Gleichung der zweiten Stufe angewendet, oder wird er sowohl auf die Gleichung der ersten als auch der zweiten Stufe angewendet?
Nehmen wir nun an, ich habe Paneldaten zu , und . Zuerst benutze ich die gruppeninterne Differenzierung, um unbeobachtete Heterogenität zu löschen, dann schätze ich die Parameter unter Verwendung des Kontrollfunktionsansatzes, als wären die Daten Querschnittsdaten (siehe oben). Muss ich einige zusätzliche Anpassungen vornehmen, wenn ich Paneldaten in Bezug auf den oben gezeigten Fall verwende?