Ich versuche, die beste Spezifikation für meinen Datensatz herauszufinden.
Ich versuche, die Wirksamkeit der Sonderwirtschaftszonen in Polen im Sinne des Wirtschaftswachstums in drei ähnlichen Paneldatenmodellen für erläuterte Variablen zu untersuchen: a) registrierte Arbeitslosenquote b) BIP pro Kopf c) Bruttoanlageinvestitionen pro Kopf . Die Daten beziehen sich auf NUTS3-Unterregionen. Die erklärenden Variablen sind: 0-1 für das Vorhandensein der SWZ in der Subregion im Jahr und einige der wirtschaftlichen Variablen; Jährliche Häufigkeit, Datensatz ist 2004-2012 für 66 Unterregionen.
Ich habe feste und zufällige Effekte ausprobiert. Im Moment habe ich mich wegen der Bedeutung und der theoretisch korrekten Vorzeichen für FE entschieden. Es gibt jedoch einige Probleme, die mich daran hindern, dies als selbstverständlich zu betrachten:
Wie teste ich auf Autokorrelation und Kreuzkorrelation?
Ich habe keine Ahnung, wie ich die Verteilung des Fehlerbegriffs in Stata testen soll, und sollte ich mich außerdem sehr darum kümmern, wenn er nicht normal verteilt ist?
Wie ich aus der Literatur verstehe, sind Werte des Korrelationskoeffizienten zwischen erklärenden Variablen und dem Fehlerterm nahe -1 oder 1 tatsächlich nicht schlecht; In meinem Fall ist es fast -1, wie Sie sehen können.
Ist ein gemischtes Modell für meinen Datensatz geeignet?
Ich füge das Ergebnis für das Modell zur Erklärung der Arbeitslosenquote bei.
Code:
xtreg st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe
Fixed-effects (within) regression Number of obs = 594
Group variable: id Number of groups = 66
R-sq: within = 0.4427 Obs per group: min = 9
between = 0.3479 avg = 9.0
overall = 0.2365 max = 9
F(6,522) = 69.10
corr(u_i, Xb) = -0.9961 Prob > F = 0.0000
-------------------------------------------------------------------------------------------
st_bezr | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
sse01 | -1.406066 .4631984 -3.04 0.003 -2.316028 -.4961045
wartosc_sr_trw_per_capita | -.0000963 .0000166 -5.79 0.000 -.0001289 -.0000636
zatr_przem_bud | -26.11989 4.992198 -5.23 0.000 -35.92716 -16.31263
podm_gosp_na_10tys_ludn | -.0201788 .0030788 -6.55 0.000 -.0262273 -.0141304
proc_ludn_wiek_prod | -229.1996 16.92631 -13.54 0.000 -262.4516 -195.9475
ludnosc_na_km2 | .0790167 .0120865 6.54 0.000 .0552726 .1027609
_cons | 161.9786 10.76989 15.04 0.000 140.821 183.1363
--------------------------+----------------------------------------------------------------
sigma_u | 53.986519
sigma_e | 2.5446248
rho | .99778327 (fraction of variance due to u_i)
-------------------------------------------------------------------------------------------
F test that all u_i=0: F(65, 522) = 27.09 Prob > F = 0.0000