Ist Just-Identified 2SLS voreingenommen im Median?

In Mostly Harmless Econometrics: Ein Empiricist's Companion (Angrist und Pischke, 2009: Seite 209) las ich Folgendes:

(...) Tatsächlich ist gerade identifizierter 2SLS (etwa der einfache Wald-Schätzer) ungefähr unvoreingenommen . Dies ist formal schwer zu zeigen, da gerade identifizierte 2SLS keine Momente haben (dh die Stichprobenverteilung hat fette Schwänze). Trotzdem ist gerade identifizierter 2SLS selbst bei schwachen Instrumenten ungefähr dort zentriert, wo er sein sollte. Wir sagen daher, dass gerade identifizierte 2SLS median-unvoreingenommen sind. (...)

Obwohl die Autoren sagen, dass gerade identifizierte 2SLS median-unvoreingenommen sind, beweisen sie dies weder noch geben sie einen Hinweis auf einen Beweis . Auf Seite 213 erwähnen sie den Satz noch einmal, jedoch ohne Hinweis auf einen Beweis. Auch in ihren Vorlesungsskripten zu instrumentellen Variablen des MIT , Seite 22 , finde ich keine Motivation für den Satz .

Der Grund kann sein, dass der Satz falsch ist, da sie ihn in einer Notiz auf ihrem Blog ablehnen . Allerdings ist gerade identifizierte 2SLS ungefähr median-unvoreingenommen, schreiben sie. Sie motivieren dies mit einem kleinen Monte-Carlo-Experiment, liefern jedoch keinen analytischen Beweis oder Ausdruck in geschlossener Form für den mit der Approximation verbundenen Fehlerterm. Wie auch immer, dies war die Antwort der Autoren auf Professor Gary Solon von der Michigan State University, der die Bemerkung machte, dass gerade identifizierte 2SLS nicht median-unvoreingenommen sind.

Frage 1: Wie beweisen Sie, dass gerade identifizierte 2SLS nicht median-unvoreingenommen sind, wie Gary Solon argumentiert?

Frage 2: Wie beweisen Sie, dass gerade identifizierte 2SLS ungefähr median-unvoreingenommen sind, wie Angrist und Pischke argumentieren?

Zu Frage 1 suche ich ein Gegenbeispiel. Für Frage 2 suche ich (hauptsächlich) einen Beweis oder einen Hinweis auf einen Beweis.

In diesem Zusammenhang suche ich auch nach einer formalen Definition von median-unvoreingenommen . Ich verstehe den Begriff wie folgt: Ein Schätzer von basierend auf einem gewissen Satz von Zufallsvariablen median unvoreingenommene für $\hat{\theta}(X_{1:n})$ $\theta$ $X_{1:n}$ $n$ $\theta$ , wenn und nur wenn die Verteilung von hat den Median . $\hat{\theta}(X_{1:n})$ $\theta$

Anmerkungen

In einem soeben identifizierten Modell entspricht die Anzahl der endogenen Regressoren der Anzahl der Instrumente.
Der Rahmen der Beschreibung ein gerade identifizierten instrumentell Variablen Modells ausgedrückt werden kann wie folgt: Das Kausalmodell von Interesse und die ersten Stufe der Gleichung wobei ist eine Matrix, die endogene Regressoren beschreibt, und wobei die instrumentellen Variablen durch eine Matrix . Hier
$\begin{matrix} (1) & {\begin{cases} Y & = X β + W γ + u \\ X & = Z δ + W ζ + v \end{cases} \end{matrix}$ $\begin{cases} Y&=X\beta+W\gamma+u \\ X&=Z\delta+W\zeta+v \end{cases}\tag{1}$ $X$ $k\times n+1$ $k$ $k\times n+1$ $Z$ $W$ beschreibt nur eine Anzahl von Steuervariablen (z. B. hinzugefügt, um die Genauigkeit zu verbessern); und und sind Fehlerausdrücke. $u$ $v$
Wir schätzen , in unter Verwendung von 2SLS: Erstens Regress auf zur Steuerung und erwerben die vorhergesagten Werte ; Dies wird die erste Stufe genannt. Zum anderen bilden sich an zur Steuerung ; Dies wird die zweite Stufe genannt. Der geschätzte Koeffizient auf in der zweiten Stufe unserer 2SLS Schätzungs . $\beta$ $(1)$ $X$ $Z$ $W$ $\hat{X}$ $Y$ $\hat{X}$ $W$ $\hat{X}$ $\beta$
Im einfachsten Fall haben wir das Modell und instrumentieren den endogenen Regressor mit . In diesem Fall wird die Schätzung von 2SLS beträgt
$y_{i} = α + β x_{i} + u_{i}$ $y_i=\alpha+\beta x_i+u_i$ $x_i$ $z_i$ $\beta$ wobeidie Probenkovarianz zwischenund. Wir können vereinfachen: $\begin{matrix} (2) & {\hat{β}}^{2SLS} = \frac{s_{Z Y}}{s_{Z X}}, \end{matrix}$ $\hat{\beta}^{\text{2SLS}}=\frac{s_{ZY}}{s_{ZX}}\tag{2},$ $s_{AB}$ $A$ $B$ $(2)$ wobei,und $\begin{matrix} (3) & {\hat{β}}^{2SLS} = \frac{\sum_{i} (y_{i} - \bar{y}) z_{i}}{\sum_{i} (x_{i} - \bar{x}) z_{i}} = β + \frac{\sum_{i} (u_{i} - \bar{u}) z_{i}}{\sum_{i} (x_{i} - \bar{x}) z_{i}} \end{matrix}$ $\hat{\beta}^{\text{2SLS}}=\frac{\sum_i(y_i-\bar{y})z_i}{\sum_i(x_i-\bar{x})z_i}=\beta+\frac{\sum_i(u_i-\bar{u})z_i}{\sum_i(x_i-\bar{x})z_i}\tag{3}$ $\bar{y}=\sum_iy_i/n$ $\bar{x}=\sum_i x_i/n$ , wobei die Anzahl der Beobachtungen ist. $\bar{u}=\sum_i u_i/n$ $n$
Ich habe eine Literatursuche mit den Wörtern "just-identification" und "median-unvoreingenommen" durchgeführt, um Referenzen zu finden, die die Fragen 1 und 2 beantworten (siehe oben). Ich habe keine gefunden. In allen Artikeln, die ich gefunden habe (siehe unten), wird auf Angrist und Pischke (2009: Seite 209, 213) verwiesen, wenn festgestellt wird, dass gerade identifizierte 2SLS median-unvoreingenommen sind.
- Jakiela, P., Miguel, E. & Te Velde, VL (2015). Sie haben es verdient: die Auswirkungen des Humankapitals auf die sozialen Präferenzen abzuschätzen. Experimental Economics , 18 (3), 385 & ndash; 407.
- An, W. (2015). Schätzungen der instrumentellen Variablen von Peer-Effekten in sozialen Netzwerken. Social Science Research , 50, 382 & ndash; 394.
- Vermeulen, W. & Van Ommeren, J. (2009). Beeinflusst die Flächennutzungsplanung die regionale Wirtschaft? Eine gleichzeitige Analyse des Wohnungsangebots, der Binnenmigration und des lokalen Beschäftigungswachstums in den Niederlanden. Journal of Housing Economics , 18 (4), 294-310.
- Aidt, TS & Leon, G. (2016). Das demokratische Zeitfenster: Beweise für Unruhen in Afrika südlich der Sahara. Journal of Conflict Resolution , 60 (4), 694-717.

— Elias
quelle

Ich konnte dies nicht mit einem formalen Beweis beantworten, sondern mit einigen Simulationsstudien, die zeigen, dass LIML median unverzerrt ist (plus Definition) und dass LIML und 2SLS mit einer endogenen Variablen und einem Instrument die gleiche kleine Stichprobenverteilung haben (also wenn LIML darin ist) Fall ist median-unvoreingenommen, so ist 2SLS). Würde dies ausreichen, um Ihre Frage zu beantworten?

— Andy

@ Andy Das wäre eine wirklich gute Antwort! Möglicherweise ausreichend, je nachdem, was andere Benutzer sagen. Wahrscheinlich ist es ausreichend, da ich denke, dass es keinen Beweis für die Behauptung gibt, dass gerade identifizierte 2SLS ungefähr median-unvoreingenommen sind. Es wäre schön, wenn ein Gegenbeispiel zeigen würde, dass gerade identifizierte 2SLS nicht median-unvoreingenommen sind. aber ich denke, es ist möglich (aber vielleicht schwierig), selbst ein Gegenbeispiel zu finden.

— Elias

Bedeuten Sie etwa, dass die Verzerrung in Abhängigkeit von der Anzahl der Beobachtungen auf Null geht, z. B. 1 / n oder 1 / n ^ 2 usw.?

— Igor

@Igor Der Ausdruck "ungefähr median-unvoreingenommen" wird von mir nicht verwendet. Da ich nicht weiß, was "median-unvoreingenommen" formal bedeutet, kann ich Ihre Frage nicht beantworten. Aber was Sie zu denken scheinen, ist ein Schätzer, der asymptotisch unvoreingenommen ist.

— Elias

In Simulationsstudien bezieht sich der Begriff Median Bias auf den absoluten Wert der Abweichungen eines Schätzers von seinem wahren Wert (den Sie in diesem Fall kennen, weil es sich um eine Simulation handelt, bei der Sie den wahren Wert wählen). Sie können ein Arbeitspapier von Young sehen (2017) , das die mittlere Abweichung wie in Tabelle 15 definiert, oder Andrews und Armstrong (2016), die die mittleren Abweichungsdiagramme für verschiedene Schätzer in Abbildung 2 darstellen.

Ein Teil der Verwirrung (auch in der Literatur) scheint auf die Tatsache zurückzuführen zu sein, dass es zwei getrennte zugrunde liegende Probleme gibt:

schwache Instrumente
viele (potentiell) schwache Instrumente

Das Problem, ein schwaches Instrument in einer soeben identifizierten Umgebung zu haben, unterscheidet sich stark von vielen Instrumenten, bei denen einige schwach sind. Die beiden Probleme werden jedoch manchmal zusammengeworfen.

$\kappa$

\hat{β} = {[X^{'} (I - κ M_{Z}) X]}^{- 1} [X^{'} (I - κ M_{Z})_{y})]

$\widehat{\beta} = \left[ X'(I-\kappa M_Z)X \right]^{-1}\left[ X'(I-\kappa M_Z)_y) \right]$

$M_Z = I-Z(Z'Z)^{-1}Z'$

\begin{aligned} y & = X β + u \\ X & = Z π + e . \end{aligned}

$\begin{align} y &= X\beta + u \\ X &= Z\pi + e. \end{align}$

$\kappa$ $\kappa = 0$ $\kappa = 1$ $\kappa$ $\det (X'X - \kappa X'M_ZX))=0$

Asymptotisch haben LIML und 2SLS die gleiche Verteilung, in kleinen Stichproben kann dies jedoch sehr unterschiedlich sein. Dies ist besonders dann der Fall, wenn wir viele Instrumente haben und einige davon schwach sind. In diesem Fall ist die Leistung von LIML besser als die von 2SLS. Es wurde gezeigt, dass LIML hier median unbefangen ist. Dieses Ergebnis stammt aus einer Reihe von Simulationsstudien. Normalerweise beziehen sich Veröffentlichungen, die dieses Ergebnis angeben, auf Rothberg (1983), "Asymptotic Properties of Some Estimators In Structural Models", Sawa (1972) oder Anderson et al. (1982) .

Steve Pischke simuliert dieses Ergebnis in seinen Notizen für 2016 für auf Folie 17 und zeigt die Verteilung von OLS, LIML und 2SLS mit 20 Instrumenten, von denen nur eines tatsächlich nützlich ist. Der wahre Koeffizientenwert ist 1. Sie sehen, dass LIML auf dem wahren Wert zentriert ist, während 2SLS auf OLS ausgerichtet ist.

Nun scheint das Argument das Folgende zu sein: Da gezeigt werden kann, dass LIML median unverzerrt ist und im eben identifizierten Fall (eine endogene Variable, ein Instrument) LIML und 2SLS äquivalent sind, muss auch 2SLS median unverzerrt sein.

Es scheint jedoch, dass die Leute den Fall "schwaches Instrument" und den Fall "viele schwache Instrumente" erneut vertauschen, da in der gerade identifizierten Einstellung sowohl LIML als auch 2SLS voreingenommen sein werden, wenn das Instrument schwach ist. Ich habe kein Ergebnis gesehen, bei dem gezeigt wurde, dass LIML in dem soeben identifizierten Fall, in dem das Instrument schwach ist, unvoreingenommen ist, und ich glaube nicht, dass dies wahr ist. Eine ähnliche Schlussfolgerung ergibt sich aus der Reaktion von Angrist und Pischke (2009) auf Gary Solo auf Seite 2, wo sie die Vorspannung von OLS, 2SLS und LIML simulieren, wenn sie die Stärke des Instruments ändern.

Für sehr kleine Koeffizienten der ersten Stufe von <0,1 (wobei der Standardfehler festgehalten wird), dh eine geringe Instrumentenstärke, ist die gerade identifizierte 2SLS (und damit die gerade identifizierte LIML) der Wahrscheinlichkeitsgrenze des OLS-Schätzers viel näher als die echter Koeffizientenwert von 1.

Sobald der Koeffizient der ersten Stufe zwischen 0,1 und 0,2 liegt, stellen sie fest, dass die F-Statistik der ersten Stufe über 10 liegt und daher nach der Daumenregel von F> 10 von Stock und Yogo (2005) kein schwaches Instrumentenproblem mehr vorliegt. In diesem Sinne verstehe ich nicht, wie LIML im gerade identifizierten Fall eine Lösung für ein schwaches Instrumentenproblem sein soll. Beachten Sie auch, dass i) LIML in der Regel stärker gestreut ist und eine Korrektur der Standardfehler erforderlich ist (siehe Bekker, 1994). Ii) Wenn Ihr Instrument tatsächlich schwach ist, werden Sie in der zweiten Stufe weder mit 2SLS noch mit LIML etwas finden weil die Standardfehler einfach zu groß werden.

— Andy
quelle

Danke für die Antwort! Das hat mir alles viel klarer gemacht.

— Elias