Warum ist die Varianz von 2SLS größer als die von OLS?


9

... Ein weiteres potenzielles Problem bei der Anwendung von 2SLS- und anderen IV-Verfahren besteht darin, dass die 2SLS-Standardfehler tendenziell "groß" sind. Mit dieser Aussage ist normalerweise gemeint, dass entweder 2SLS-Koeffizienten statistisch nicht signifikant sind oder dass der 2SLS-Standard Fehler sind viel größer als die OLS-Standardfehler. Es überrascht nicht, dass die Größen der 2SLS-Standardfehler unter anderem von der Qualität der bei der Schätzung verwendeten Instrumente abhängen.

Dieses Zitat stammt aus Wooldridges "Ökonometrische Analyse von Querschnitts- und Paneldaten" . Ich frage mich, warum das passiert? Ich würde eine mathematische Erklärung vorziehen.

Unter der Annahme der Homoskedastizität ist der Einfachheit halber die (geschätzte) asymptotische Varianz des OLS-Schätzers gegeben durch

EINveinr^(β^ÖL.S.)=nσ2(X.'X.)- -1
während für den 2SLS-Schätzer wobei
Avar^(β^2SLS)=nσ2(X^X^)1
X^=PzX=Z(ZZ)1ZX.

X ist die Matrix der Regressoren, einschließlich der endogenen, und ist die Matrix der instrumentellen Variablen.Z.

Das Umschreiben der Varianz für 2SLS ergibt also

EINveinr^(β^2S.L.S.)=nσ2(X.'Z.(Z.'Z.)- -1Z.'X.)- -1.

Ich kann jedoch aus den obigen Formeln nicht schließen, dass .EINveinr^(β^2S.L.S.)EINveinr^(β^ÖL.S.)


Ich denke, Sie haben vergessen, das Gegenteil in Ihrem letzten Ausdruck von Avar von 2SLS zu nehmen.
Richard Hardy

Sie haben Recht, korrigiert.
Tosik

Ich habe einige kleine Änderungen vorgenommen, insbesondere in Bezug auf die Definition von Z.. Bitte prüfe.
Christoph Hanck

Antworten:


6

Wir sagen, eine Matrix ist mindestens so groß wieAB wenn ihr Unterschied AB ist positiv semidefinit (psd).

Eine äquivalente Aussage, die sich hier als einfacher zu überprüfen herausstellt, ist diese B1A1 ist psd (ähnlich a>b ist äquivalent zu 1/b>1/a).

Also wollen wir das überprüfen

XXXZ(ZZ)1ZX
ist psd.

Schreiben

XXXZ(ZZ)1ZX=X(IZ(ZZ)1Z)X=XMZX
Um das zu überprüfen XMZX ist psd, wir müssen das für jeden Vektor zeigen d,
dXMZXd0
Lassen c=Xd. Dann,
cMZc0
wie MZ ist eine symmetrische und idempotente Projektionsmatrix, die als psd bekannt ist: Schreiben unter Verwendung von Symmetrie und Idempotenz,
cMZc=cMZMZc=cMZMZc
und lass e=MZc, damit cMZc=ee=iei2, die als Summe der Quadrate nicht negativ sein muss.

PS: Zwei kleine Probleme - Sie beziehen sich auf die geschätzten asymptotischen VarianzenAvar^(β^j). Nun der OLS-Schätzer und der 2SLS-Schätzer vonσ2sind nicht gleich, so dass ich nicht sehe, dass das Ranking unbedingt beibehalten werden muss, wenn diese Schätzungen abweichen. Auch die asymptotischen Varianzen werden im Allgemeinen durch skaliertn um eine nicht entartete Menge als zu erhalten n. (Natürlich beide skalieren durchn wird das Ranking nicht beeinflussen, so dass das Problem für diese spezielle Frage ein wenig umstritten ist.)


Vielen Dank für Ihre Antwort. Die asymptotische Varianz sollte tatsächlich durch geteilt werdenn(korrigiert). Ich denke, es gibt einen Tippfehler, wenn Sie anrufenMzProjektionsmatrix, ich denke, es heißt Vernichtermatrix. Wie auch immer, könnten Sie bitte Einzelheiten dazu angeben?Mzist psd. Ich verstehe auch nicht ganz Ihren Standpunkt, für den OLS- und 2SLS-Schätzerσ2sind nicht gleich, könnten Sie näher erläutern, was es bedeutet?
Tosik

Ich habe einige Details hinzugefügt. M ist in der Tat am besten als Vernichtermatrix bekannt, aber da sie auch auf einen bestimmten Raum projiziert (das orthogonale Komplement des Bildes von P) Es ist auch eine Projektionsmatrix.
Christoph Hanck

Vielen Dank für die Klarstellung und Änderungen (ich weiß nicht, warum ich mich entschieden habe, durch zu teilen n). Könntest du deinen ersten Punkt in PS erklären?
Tosik

Um es wirklich zur geschätzten asymptotischen Varianz zu machen, benötigen Sie einen Schätzerσ^2. Der OLS-Schätzer vonσ2 basiert auf den OLS-Residuen, während der 2SLS-Schätzer Residuen verwendet yXβ^2SLS schätzen σ2. Diese Schätzungen können in beiden Richtungen unterschiedlich sein und möglicherweise die Rangfolge der Abweichungen beeinflussen.
Christoph Hanck

3

Ich denke, dies ist eine der Situationen, in denen es viel einfacher ist, die einfache Einstellung einer Gleichung und einer Variablen zu betrachten. Technisch gesehen handelt es sich also um eine IV-Regression und nicht um 2SLS (aber das Ergebnis ist immer noch allgemein). Daher werden wir für einige ein Modell (in Wooldridge-Notation) annehmeni wir haben:

yi=β0+β1xi1+ui

Wenn wir nun annehmen, dass dieses Modell den Gauß-Markov-Annahmen folgt, dann wissen wir (siehe jedes anständige Lehrbuch), dass die asymptotische Varianz von β^1 ist gegeben durch:

Avar(β^OLS)=σ^2SSTx

Wo SSTx ist die Gesamtsumme der Quadrate für x. Wenn wir stattdessen davon ausgehenx ist (möglich) endegonoues und verwenden IV Regression mit z als Instrument ist dann die asymptotische Varianz des IV-Schätzers:

Avar(β^iv)=σ^2SSTxRx,z2

Schon seit R2 ist immer dazwischen 0 und 1muss der Nenner für den IV-Schätzer kleiner sein als für OLS (wenn OLS tatsächlich gültig ist).


0

Nur ein Kommentar. Ich denke, es ist ziemlich klar, dass die Schätzung der Varianz der Fehler bei Verwendung von 2SLS höher ist. Denken Sie daran, dass OLS die Schätzung dieser Varianz minimiert. Daher sollte jeder andere Schätzer eine höhere Stichprobenschätzung der Varianz der Fehler haben.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.