Ein nettes Merkmal von Difference-in-Differences (DiD) ist, dass Sie keine Paneldaten dafür benötigen. Da die Behandlung auf einer bestimmten Aggregationsebene erfolgt (in Ihren Fallstädten), müssen Sie vor und nach der Behandlung nur zufällige Personen aus den Städten befragen. Dies ermöglicht es Ihnen, y i s t = A g + B t + β D s t + c X i s t + ϵ i s t zu schätzen
yi s t= A.G+ B.t+ βD.s t+ c X.i s t+ ϵi s t
und erhalten Sie den kausalen Effekt der Behandlung als den erwarteten Unterschied nach dem Ergebnis für die behandelte Person abzüglich des erwarteten Unterschieds nach dem Ergebnis für die Kontrolle.
yi t= αich+ B.t+ βD.i t+ c X.i t+ ϵi t
D.i t von Steve Pischke.
EING
Hier ist ein Codebeispiel, das zeigt, dass dies der Fall ist. Ich verwende Stata, aber Sie können dies im Statistikpaket Ihrer Wahl replizieren. Die "Individuen" hier sind eigentlich Länder, aber sie sind immer noch nach einem Behandlungsindikator gruppiert.
* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"
* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated
* do the standard DiD regression
reg y_bin time treated did
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .1212795 3.09 0.003 .1328576 .6171424
treated | .4166667 .1434998 2.90 0.005 .13016 .7031734
did | -.4027778 .1852575 -2.17 0.033 -.7726563 -.0328992
_cons | .5 .0939427 5.32 0.000 .3124373 .6875627
------------------------------------------------------------------------------
* now repeat the same regression but also including country fixed effects
areg y_bin did time treated, a(country)
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .120084 3.12 0.003 .1348773 .6151227
treated | 0 (omitted)
did | -.4027778 .1834313 -2.20 0.032 -.7695713 -.0359843
_cons | .6785714 .070314 9.65 0.000 .53797 .8191729
-------------+----------------------------------------------------------------
Sie sehen also, dass der DiD-Koeffizient gleich bleibt, wenn die einzelnen festen Effekte enthalten sind ( areg
ist einer der verfügbaren Schätzbefehle für feste Effekte in Stata). Die Standardfehler sind etwas enger und unser ursprünglicher Behandlungsindikator wurde von den einzelnen festen Effekten absorbiert und fiel daher in die Regression.
Als Antwort auf den Kommentar
erwähnte ich das Pischke-Beispiel, um zu zeigen, wann Menschen einzelne feste Effekte anstelle eines Behandlungsgruppenindikators verwenden. Ihre Einstellung hat eine genau definierte Gruppenstruktur, sodass die Art und Weise, wie Sie Ihr Modell geschrieben haben, vollkommen in Ordnung ist. Standardfehler sollten auf Stadtebene gruppiert werden, dh auf der Aggregationsebene, auf der die Behandlung erfolgt (ich habe dies im Beispielcode nicht getan, aber in den DiD-Einstellungen müssen die Standardfehler korrigiert werden, wie in der Veröffentlichung von Bertrand et al. Gezeigt ).
D.s tst
c = [ E.( yi s t| s=1,t=1)-E.( yi s t| s=1,t=0)]- [ E.( yi s t| s=0,t=1)-E.( yi s t| s=0,t=0)]
E.( yi s t| s=1,t=1)E.( yi s t| s=0,t=1). Um zu verdeutlichen, warum die Identifizierung von den Gruppenunterschieden im Zeitverlauf und nicht von den Bewegern herrührt, können Sie dies mit einem einfachen Diagramm visualisieren. Angenommen, die Änderung des Ergebnisses ist wirklich nur auf die Behandlung zurückzuführen und hat eine gleichzeitige Wirkung. Wenn wir eine Person haben, die nach Beginn der Behandlung in einer behandelten Stadt lebt und dann in eine Kontrollstadt zieht, sollte ihr Ergebnis auf das zurückgehen, was es vor der Behandlung war. Dies ist in der folgenden stilisierten Grafik dargestellt.
Vielleicht möchten Sie aus anderen Gründen immer noch an Mover denken. Zum Beispiel, wenn die Behandlung eine dauerhafte Wirkung hat (dh sie beeinflusst immer noch das Ergebnis, obwohl sich die Person bewegt hat)