Sie benötigen keine Annahmen zu den 4. Momenten für die Konsistenz des OLS-Schätzers, aber Sie benötigen Annahmen zu höheren Momenten von und für die asymptotische Normalität und um die asymptotische Kovarianzmatrix konsistent abzuschätzen.ϵxϵ
In gewissem Sinne ist dies jedoch ein mathematischer, technischer Punkt, kein praktischer Punkt. Damit OLS in gewisser Weise in endlichen Proben gut funktioniert, sind mehr als die minimalen Annahmen erforderlich, die erforderlich sind, um eine asymptotische Konsistenz oder Normalität als .n → ∞
Ausreichende Bedingungen für die Konsistenz:
Wenn Sie eine Regressionsgleichung haben:
yich= x'ichβ + ϵich
Der OLS-Schätzer kann wie geschrieben werden:
b =β+( X ' Xb^
b^= β + ( X.'X.n)- 1( X.'ϵn)
Aus Gründen der Konsistenz müssen Sie in der Lage sein, das Kolmogorovsche Gesetz der großen Zahlen oder im Fall von Zeitreihen mit serieller Abhängigkeit so etwas wie den Ergodischen Satz von Karlin und Taylor anzuwenden, damit:
1nX.'X.→pE [ xichx'ich]]1nX.'ϵ →pE [ x'ichϵich]]
Weitere erforderliche Annahmen sind:
- E [ xichx'ich]] hat den vollen Rang und daher ist die Matrix invertierbar.
- Regressoren sind vorbestimmt oder streng exogen, so dass .E [ xichϵich] = 0
Dann und Sie erhalten b p →& bgr;( X.'X.n)- 1( X.'ϵn) →p0b^→pβ
Wenn Sie der zentrale Grenzwertsatz anwenden möchten , dann müssen Sie Annahmen über höhere Momente, zum Beispiel , wo . Der zentrale Grenzwertsatz gibt Ihnen die asymptotische Normalität von und ermöglicht es Ihnen, über Standardfehler zu sprechen. Damit der zweite Moment existiert, müssen die vierten Momente von und existieren. Sie möchten argumentieren, dass wog i = x i ε i b E [ g i g ' i ] x ε √E [ gichG'ich]]Gich= xichϵichb^E [ gichG'ich]]xϵΣ=E[xix ' i ϵ 2 i ]Σn- -- -√( 1n∑ichx'ichϵich) →dN.( 0 , Σ )Σ = E [ xichx'ichϵ2ich]] . Damit dies funktioniert, muss endlich sein.Σ
Eine nette Diskussion (die diesen Beitrag motiviert hat) findet sich in Hayashis Ökonometrie . (Siehe auch S. 149 für den 4. Moment und die Schätzung der Kovarianzmatrix.)
Diskussion:
Diese Anforderungen an den 4. Moment sind wahrscheinlich eher ein technischer als ein praktischer Punkt. Sie werden wahrscheinlich nicht auf pathologische Verteilungen stoßen, bei denen dies ein Problem in alltäglichen Daten ist? Es ist für allgemeinere oder andere Annahmen von OLS, schief zu gehen.
Eine andere Frage, die zweifellos an anderer Stelle auf Stackexchange beantwortet wird, ist, wie groß eine Stichprobe ist, die Sie für endliche Stichproben benötigen, um den asymptotischen Ergebnissen nahe zu kommen. In gewisser Weise führen fantastische Ausreißer zu einer langsamen Konvergenz. Versuchen Sie beispielsweise, den Mittelwert einer logarithmischen Normalverteilung mit sehr hoher Varianz zu schätzen. Der Stichprobenmittelwert ist ein konsistenter, unvoreingenommener Schätzer des Populationsmittelwerts, aber in diesem logarithmischen Normalfall mit verrückter überschüssiger Kurtosis usw. (folgen Sie dem Link) sind die Ergebnisse der endlichen Stichproben wirklich ziemlich falsch.
Endlich gegen unendlich ist eine äußerst wichtige Unterscheidung in der Mathematik. Das ist nicht das Problem, auf das Sie in der täglichen Statistik stoßen. Praktische Probleme liegen eher in der Kategorie klein gegen groß. Ist die Varianz, Kurtosis usw. klein genug, um angesichts meiner Stichprobengröße vernünftige Schätzungen zu erzielen?
Pathologisches Beispiel, bei dem der OLS-Schätzer konsistent, aber nicht asymptotisch normal ist
Erwägen:
x i ~ N ( 0 , 1 ) ε i V ein r ( ε i ) = ∞ b b b
yich= b xich+ ϵich
Wobei aber aus einer t-Verteilung mit 2 Freiheitsgraden gezogen wird, also . Die OLS-Schätzung konvergiert in der Wahrscheinlichkeit gegen aber die Stichprobenverteilung für die OLS-Schätzung ist nicht normal verteilt. Unten ist die empirische Verteilung für basierend auf 10000 Simulationen einer Regression mit 10000 Beobachtungen.
xich∼ N.( 0 , 1 )ϵichV a r ( ϵich) = ∞bb^b^
Die Verteilung von ist nicht normal, die Schwänze sind zu schwer. Wenn Sie jedoch die Freiheitsgrade auf 3 erhöhen, sodass der zweite Moment von existiert, gilt die zentrale Grenze und Sie erhalten:
εib^ϵich
Code zum Generieren:
beta = [-4; 3.7];
n = 1e5;
n_sim = 10000;
for s=1:n_sim
X = [ones(n, 1), randn(n, 1)];
u = trnd(2,n,1) / 100;
y = X * beta + u;
b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));