Betrachten Sie das folgende multiple Regressionsmodell: Y=Xβ+Zδ+U.(1)
Hier ist Y ein n×1 Spaltenvektor; X a n×(k+1) Matrix; β a (k+1)×1 Spaltenvektor; Z a n×l Matrix; δ a l×1 Spaltenvektor; und U , der Fehlerterm, ein n×1 Spaltenvektor.
FRAGE
Mein Dozent, das Lehrbuch Einführung in die Ökonometrie, 3. Aufl.
von James H. Stock und Mark W. Watson, p. 281 und Ökonometrie: Honor's Exam Review Session (PDF) , p. 7, hat mir folgendes ausgedrückt.
- Wenn wir annehmen, was als bedingte mittlere Unabhängigkeit bezeichnet wird , was per Definition bedeutet, dass
E(U|X,Z)=E(U|Z),(2)
und wenn die Annahme der kleinsten Quadrate mit Ausnahme der bedingten mittleren Nullannahme E(U|X,Z)=0 erfüllt ist (also nehmen wir E(U|X,Z)=E(U|Z)≠0 ) (siehe 1- 3 unten),
Dann wird der OLS Schätzer β von β in ( 1 ) bleibt unvoreingenommene und konsistente, im Rahmen dieser schwächeren Reihe von Annahmen.β^β(1)
Wie beweise ich diesen Vorschlag? Das heißt, dass 1 und 2 oben implizieren, dass die OLS-Schätzung von β uns einen unvoreingenommenen und konsistenten Schätzer für β liefert ? Gibt es einen Forschungsartikel, der diesen Vorschlag belegt?
KOMMENTAR
Der einfachste Fall ergibt sich aus der Betrachtung des linearen Regressionsmodells Yi=β0+β1Xi+β2Zi+ui,i=1,2,…,n,
und beweisendass die OLS schätzen β 1 von & bgr; 1 istwenn unvoreingenommene E ( u i | X i , Z i ) = E ( u i | Z i ) für jedes i .β^1β1E(ui|Xi,Zi)=E(ui|Zi)i
Beweis der Unbeschwertheit unter der Annahme, dass Ui und Zi GEMEINSAM NORMAL VERTEILT SIND
Definiere V=U−E(U|X,Z) , dann U=V+E(U|X,Z) und E(V|X,Z)=0.(*)
So (1) kann umgeschrieben werden als Y=Xβ+Zδ+E(U|X,Z)+V.(3)
Durch(2)folgt danndassY=Xβ+Zδ+E(U|Z)+V.(4)
Da nunUiundZigemeinsam normalverteilt sind, ist die Theorie der Normalverteilungen vgl. Die Ableitung der bedingten Verteilungen einer multivariaten Normalverteilungbesagt, dass (tatsächlich müssen wir keine gemeinsame Normalität annehmen, sondern nur diese Identität)E(U|Z)=Zγ(**)
für einigelmal1Vektorγ≠0.
Jetzt (4) wird Y=Xβ+Z(δ+γ)+V.(5)
Für das Modell (5) alle Annahmen der kleinsten Quadrate erfüllt, da der Fehlerterm V die Annahme des bedingten Mittelwerts Null erfüllt. Dies bedeutet , dass die OLS Schätzung β von β unvoreingenommen sein wird, denn wenn wir lassen ρ = δ + γ und lassen W = ( X , Z ) kann dieβ^βρ=δ+γW=(X,Z)n von(k+1)+l Matrix ausX undZ , dann schätzen die OLS vonβ in(5) ist gegeben durch die folgende Berücksichtigung ( β T , ρ T ) T(β^T,ρ^T)T=(WTW)−1WTY=(WTW)−1WT(W(βT,ρT)T+V)=(βT,ρT)T+(WTW)−1WTV
und somit E((β^T,ρ^T)T|W)=(βT,ρT)T+(WTW)−1WsTE(V|W)=(βT,ρT)T+(WTW)−1WT0=(βT,ρT)T,
wobei die zweite Zeile durch(∗)folgt. Somit β ist eine bedingt unvoreingenommene Abschätzung desβda die OLS fürModell gegeben Schätzung(1)coinicides mit derjenigen fürModell gegeben(5). Nun, durch das Gesetz der Gesamt Erwartung E ( β )β^β(1)(5)E(β^)=E(E(β^|W))=E(β)=β,
und somit β ist ein unverzerrter Schätzer fürβ.β^β
(Man kann bemerken , daß E(ρ^)=ρ=δ+γ≠δ , so daß der Koeffizient auf Z ist nicht notwendigerweise unvoreingenommene.)
Der obige Sonderfall geht jedoch davon aus, dass Ui und Zi gemeinsam normalverteilt sind. Wie beweise ich den Satz ohne diese Annahme?
Angenommen, E(U|Z)=Zγ reicht natürlich immer aus (vgl. (∗∗) ), aber ich soll das Ergebnis nur unter Verwendung von (2) und der Annahme der kleinsten Quadrate ohne die Annahme des bedingten mittleren Nullpunkts ableiten (siehe unten).
IN BEZUG AUF KONSISTENZ
β^β(5)V(∗)
(∗∗)(2)
SUBQUERY 1
(∗∗)
DIE MINDESTQUADRATISCHEN ANNAHMEN
E(U|X,Z)=0E(U|X,Z)≠0ZU
Die Annahme der kleinsten Quadrate ist die folgende.
(Yi,Xi,Zi)i=1,2,…,n,YiiYXiZiiXZ
iXi,ZiUiUiiU
(X,Z)WTW
Var(Ui|Xi,Zi)=σ2UiUi(Xi,Zi)i
HINWEIS ZUR TERMINOLOGIE
(1)E(U|X,Z)=0E(U|X,Z)=E(U|Z)
Diese Terminologie wird zB in Introduction to Econometrics, 3. Aufl. von James H. Stock und Mark W. Watson, p. 281; und ökonometrische Analyse von Querschnitts- und Paneldaten, 1. Aufl. von Jeffrey M. Wooldridge, p. 607. Siehe auch Bedingte Unabhängigkeitsbeschränkungen: Testen und Schätzen für ähnliche Diskussionen.
ZUSÄTZLICHE GEDANKEN UND SUBQUERY 2
βE(U|Z)E(U|Z)=p(Z)p(Z)ZE(U|Z)=exp(Zγ)γββ(4)E(U|Z)
Eine zusätzliche Frage ist daher, ob es ein Gegenbeispiel zu der These gibt, dass die bedingte mittlere Unabhängigkeit zu einer unvoreingenommenen OLS-Schätzung führt.
SUBQUERY 3
YXWXYXYXWX(1) ist weniger voreingenommen als wenn CI nicht gilt (alle anderen gleich).
Kann diese Idee irgendwie verwendet werden, um meine Hauptfrage hier zu beantworten?