Verwirrung über die Annahme der Homoskedazität

3

In meinem Einführungskurs in die Ökonometrie haben wir die GM-Annahmen und die Homoskedastizität diskutiert. Leider habe ich einige Verwirrungen und miteinander verknüpfte Fragen, daher frage ich mich, ob mir jemand bitte bei meinem Verständnis helfen könnte.

Modell: $y_i = \beta_0 + \beta_1 x_i + u_i$

Was ist der Unterschied zwischen $E[u] = 0$ und $E[u|x] = 0$ ? Bedeutet das erstere das letztere?

Ich verstehe , dass diese Marken , dass der bedingten Mittelwert, dh , dass der erwartete Wert von $u$ ist $\sigma^2$ unabhängig von $x$ , aber ist das nicht durch die bedingungslosen Mittel implizierte? Ist eine davon eine stärkere Annahme?

Bedeutet das obige $cov(u,x) = 0$ und wie? Was ist der Unterschied zwischen $cov(y,x)$ und $cov(u_i,x_i)$ ?

Wir haben festgestellt, dass die Annahme der Homoskedastizität keine Kovarianz zwischen $u$ und $x$ impliziert , aber wie kommt es dazu? Und warum wird es als "schwächere Annahme" bezeichnet (zumindest von Woolridge)? Was mich wirklich verwirrt, ist, dass wir oft die Notation $cov(u_i,x_i)$ anstelle von $cov(u,x)$ - gibt es einen Unterschied? Wenn sich das erste auf ein bestimmtes $i$ bezieht , hat es dann überhaupt eine Bedeutung?

Entschuldigung, wenn diese Fragen eher trivial sind. Und vielen Dank für Ihre Hilfe!

econometrics

— Jhonny
quelle

1

Ist nicht

statt

? E[u]=0 $E[u] = 0$

σ2 $\sigma^2$

— Giskard,

3

Sollte es nicht Varianz

? V[u]=σ2 $V[u]=\sigma^2$

— Adam Bailey

@AdamBailey Da das OP die Homoskedastizität erwähnt, haben Sie wahrscheinlich recht. Leider habe ich Ihren Kommentar erst gesehen, nachdem ich meine lange Antwort beendet habe.

— Giskard

6

Eine intuitive Erklärung könnte helfen.

(i) $E[u]=0$ gegen $E[u|x]=0$ : Stellen Sie sich vor, Sie dividieren die Population durch den Wert von $x$ sodass in jedem Teil der Population derselbe Wert von $x$ ist. Sie können dann den Mittelwert von $u$ für jede Scheibe erhalten. " $E[u|x]=0$ ", was eine Abkürzung von " $E[u|x=c]=0$ für (fast) alle $c$ ", bedeutet, dass der Durchschnitt von $u$ in jeder Partition Null ist. Sie können auch den Durchschnitt von $u$ für die gesamte Bevölkerung ermitteln." $E[u]=0$ "bedeutet, dass der Durchschnitt von $u$ für die gesamte Bevölkerung Null ist.

Zum Beispiel sei $x$ Jahre der Bildung. $E[u|x]=0$ bedeutet, dass der Durchschnitt von $u$ für diejenigen mit 9 Jahren Ausbildung Null ist, der Durchschnitt von $u$ für diejenigen mit 10 Jahren Ausbildung Null ist usw., während $E[u]=0$ bedeutet, dass der Durchschnitt von $u$ für die gesamte Bevölkerung ist Null.

Sie sehen, dass " $E[u|x]=0$ " eine Art " " impliziert $u$ nicht mit $x$ verwandt ist ", und dies wird als mittlere Unabhängigkeit bezeichnet . Andererseits sagt $E[u]=0$ nichts über die Beziehung zwischen $u$ und $x$ . $E[u]=0$ macht Sinn, ohne dass $x$ involviert ist, während $E[u|x]=0$ macht nur in Bezug auf $x$ Sinn .

(ii) $var(u)=\sigma^2$ vs $var(u|x)=\sigma^2$ :Man stelledie Population Partitionieren durch den Wert von . Sie können die Varianz von für jede Scheibe erhalten. ' ' bedeutet, dass die Varianz von für jede Partition . Hier ist der entscheidende Punkt, dass ist eine Konstante und ist nicht an . Dies bedeutet, dass alle Schichten die gleiche Varianz haben. $x$ $u$ $var(u|x)=\sigma^2$ $u$ $\sigma^2$ $\sigma^2$ $x$ $var(u|x)=\sigma^2$ ist sehr informativ. Als nächstes können Sie auch die Varianz erhalten $u$ für die gesamte Bevölkerung, und $var(u)=\sigma^2$ bedeutetdass die Varianz (von $u$ für die Gesamtbevölkerung) bezeichnet $\sigma^2$ , wobei $\sigma^2$ nur eine Schreibweise ist.

$var(u|x)$ kann von $x$ (Heteroskedastizität)abhängen, aber es ist völlig unsinnig zu fragen, ob $var(u)$ von $x$ abhängt,weil $var(u)$ von Anfangan nichts mit $x$ zu tun hat( es sei denn, Sie meinen $var(u|x)$ mit $var(u)$ ).

(iii) $cov(x,u)=0$ : Dies bedeutet nur, dass $cov(x,u)=0$ , wobei definiert ist als . In Ihrem Fall weil $cov(a,b)$ $E[(a-Ea)(b-Eb)]$ $cov(x,u)=E[xu]$ $E[u]=0$ . Wenn Sie eine Vorstellung über die Bedeutung von $cov(x,u)=0$ benötigen, stellen Sie sich vor, Sie haben $(x,u)$ -Werte für die gesamte Grundgesamtheit in der XY-Ebene aufgetragen, wobei $x$ auf der horizontalen Achse und $u$ auf der vertikalen Achse liegt . Sie zeichnen eine schöne gerade Linie (wo es wichtig ist, gerade zu sein). $cov(x,u)=0$ bedeutet, dass die Gerade horizontal ist. Es sagt etwas darüber aus, dass $u$ und $x$ nicht verwandt sind, und wenn es passiert, sagen wir, dass " $x$ und $u$ nicht korreliert sind".

$E[u|x]=0$ impliziert $cov(x,u)=0$ , aber nicht umgekehrt, was der Grund istwarum istschwächerals . Sie können es mit dem Gesetz der wiederholten Erwartungen beweisen: . Nehmen wir für ein Gegenbeispiel umgekehrt an, dass $cov(x,u)$ $E[u|x]=0$ $E[xu] = E[xE(u|x)] = E[x\cdot 0]=E[0]=0$ $x\sim N(0,1)$ und $u=x^2-1$ . Dann ist $E[u|x]=x^2-1$ , was nicht Null ist, außer $x=\pm 1$ aber $cov(x,u) = E[x(x^2-1)] = E[x^3]-E[x]=0-0=0$ .

(iv) Was ist der Unterschied zwischen $cov(y,x)$ und $cov(u,x)$ ? Wenn $y=\beta_0 + \beta_1 x +u$ , $cov(y,x) = cov(\beta_0+\beta_1 x+u,x) = \beta_1 cov(x,x) + cov(u,x)$ , wobei $cov(x,x) = var(x)$ per Definition. Das ist der unterschied

HINZUFÜGEN:

Ich habe bemerkt , nur die Verwirrung des OP über $cov(x_i,u_i)$ und $cov(x,u)$ . Erstens kann $cov(x,u)$ intuitiv als die oben in (iii) erläuterte Bevölkerungseigenschaft verstanden werden. $cov(x,u)$ handelt von der Population und sagt nichts über die Stichprobe aus. Die Notation $cov(x_i,u_i)$ ist auf der anderen Seite über die Probe, und inTat soll so etwas wie "bedeutet $cov(x_i,u_i)$ , $i=1,\ldots,n$ ", dh $cov(x_1,u_1)$ , , ... und . Sie sind alle gleich, wenn die erste Person, die zweite Person, ..., die $cov(x_2,u_2)$ $cov(x_n,u_n)$ $n$ te Person unabhängige Zufallszahlen aus derselben Population sind (was die Bedeutung von $iid$ ). Wenn sie aus verschiedenen Populationen stammen, kann $cov(x_i, u_i)$ für verschiedene $i$ unterschiedlich sein , aber ich bin mir ziemlich sicher, dass Sie von $iid$ .

Nun, was ist $cov(x_1,u_1)$ dann? Das ist der schwierige Teil. Um seine Bedeutung zu verstehen, sollten Sie verstehen, dass einZufallsvektor ist, dessen Wert sich ändern kann, wenn Sie die Abtastung in Ihren Gedankenexperimenten wiederholen. (Dies wird Sie so lange verwirren, bis Sie diesen Punkt verstanden haben.) Die "erste Person" in der Stichprobe ändert sich immer wieder, wenn Sie die Stichprobe immer wieder in Ihrem Kopf zeichnen, und damit die über den wiederholten Stichproben. Wenn Sie die erste Beobachtung unabhängig von der Grundgesamtheit zeichnen, in der Sie über sprechen $(x_1,u_1)$ $(x_1,u_1)$ Der Wert ändert sich bei wiederholten Proben. Wenn Sie also die Abtastung auf unbestimmte Zeit wiederholen, ändern sich die Werte von $x_1$ und $u_1$ und bilden eine (gemeinsame) Verteilung. $cov(x_1,u_1)$ ist die Kovarianz dieser gemeinsamen Verteilung. Ebenso können Sie $cov(x_2,u_2)$ als die Kovarianz von $x_2$ und verstehen $u_2$ $cov(x,u)$ , ist $cov(x_1,u_1) = cov(x,u)$ .

Wenn wir also über das Populationsvermögen sprechen, verwenden wir die Notation $cov(x,u)$ . Wenn wir über die Kovarianz von $x_1$ und $u_1$ (über wiederholte Samples) sprechen , verwenden wir die Notation $cov(x_1,u_1)$ . Die Notation $cov(x_i,u_i)$ ist eine (schlampige) Kurznotation von $cov(x_1,u_1), \ldots, cov(x_n,u_n)$ . " $cov(x_i,u_i)$ " selbst macht nicht viel Sinn, bis Sie sagen, was $i$ bin, wie in " $cov(x_i,u_i)$ ist Null für jedes $i=1,\ldots,n$ " , oder " $cov(x_i,u_i)$ ist für alle NichtNull $i=1,\ldots,n$ , aber sie sind für alle gleich $i$ .“Die Aussage " $cov(x_i,u_i)=0$ " istRegel ein fauler (oder ungeschickt) schriftlich " $cov(x_i,u_i)=0$ für alle $i=1,\ldots,n$ ", was $cov(x_1,u_1)=0$ , $cov(x_2,u_2)=0$ , ..., $cov(x_n,u_n)=0$ .

— chan1142
quelle

2

chan1142: schöne antwort. Ich habe meinen Kommentar gelöscht, weil ich an einen heterogenen Fall dachte, nach dem er nicht wirklich fragt, wenn man bedenkt, wie Sie es erklärt haben. sehr schöne erklärung.

— Markieren Sie Leeds

1

Nur um die vorherige Antwort zu ergänzen, da ich nicht genug Reputation habe, um einen Kommentar abzugeben:

Im Allgemeinen gilt für die Zufallsvariablen $X$ und $Y$ : $\mathop{{}\mathbb{E}}[Y|X = x]$ gibt an, was der erwartete Wert von ist $Y$ ist, wenn $X = x$ . Beachten Sie, dass dies eine reelle Zahl ist! Wenn $X$ und $Y$ unabhängig sind, dann $\mathop{{}\mathbb{E}}[Y|X = x] = \mathop{{}\mathbb{E}}[Y]$ .

Wir können dies jedoch verwenden, um die bedingte Erwartung von $Y$ gegebenem $X$ als Zufallsvariable zu definieren, die für den Bereich von X definiert ist:

$\mathop{{}\mathbb{E}}[Y|X](x) = \mathop{{}\mathbb{E}}[Y|X = x]$ Dies ist eine Zufallsvariable, da wir den Wert von apriori nicht kennen

$X$ .

$x$ ist der Wert, den die Zufallsvariable

$X$ je nach Ergebnis annimmt. Somit ist die ‚Quelle‘ der Zufälligkeit

$X$ .

Eine wichtige Beziehung ist:

$\mathop{{}\mathbb{E}}[Y] = \mathop{{}\mathbb{E}}[\mathop{{}\mathbb{E}}[Y|X]]$ wobei die äußerste Erwartung in Bezug auf den Wert

$X$ .

Wir können jetzt Ihre Frage beantworten.

$\mathop{{}\mathbb{E}}[u|x] = 0$ für alle $x$ impliziert $\mathop{{}\mathbb{E}}[u] = 0$ Verwendung der obigen Beziehung, wobei zu beachten ist, dass die Erwartung einer konstanten Zufallsvariablen dieselbe Konstante ist (hier $0$ ).

— Ameya
quelle