Warum spielt die Korrelation von Residuen beim Testen auf Normalität keine Rolle?


9

Wenn (dh stammt aus dem linearen Regressionsmodell), ist und in diesem Fall Residuen sind korreliert und nicht unabhängig. Wenn wir jedoch eine Regressionsdiagnose durchführen und die Annahme testen möchten, schlägt jedes Lehrbuch vor, Q-Q-Diagramme und statistische Tests für Residuen Diese wurden entwickelt, um zu testen, ob für einige .Y=AX+εY

εN(0,σ2I)e^=(IH)YN(0,(IH)σ2)
e^1,,e^nεN(0,σ2I)e^e^N(0,σ2I)σ2R

Wie kommt es, dass für diese Tests Residuen nicht korreliert und nicht unabhängig sind? Es wird oft empfohlen, standardisierte Residuen zu verwenden: aber das macht sie nur homoskedastisch, nicht unabhängig.

e^i=e^i1hii,

Um die Frage neu zu formulieren: Residuen aus der OLS-Regression werden korreliert. Ich verstehe, dass diese Korrelationen in der Praxis so klein sind (meistens? Immer?), Dass sie ignoriert werden können, wenn getestet wird, ob Residuen aus der Normalverteilung stammen. Meine Frage ist, warum?


1
Macht sie homoskedastisch.
Scortchi - Monica wieder einsetzen

1
Fragen Sie nach der Anwendbarkeit dieser Tests, wenn Residuen starke Korrelationen aufweisen, oder sind Sie nur besorgt über die (sehr geringfügige und belanglose) negative Korrelation, die sich aus dem Schätzverfahren für kleinste Quadrate ergibt?
whuber

1
@whuber Ich frage nach der Korrelation, die sich aus dem Schätzverfahren für kleinste Quadrate ergibt. Wenn sie geringfügig und belanglos sind, würde ich gerne wissen, warum.
Zoran Loncarevic

Antworten:


3

In Ihrer Notation ist die Projektion und der Spaltenraum von , dh der Unterraum aller Regressoren. Daher ist die Projektion auf alles orthogonal zum Unterraum, der von allen Regressoren überspannt wird.HXM:=InH

Wenn , dann ist singulär normalverteilt und die Elemente sind korreliert, wie Sie angeben.XRn×ke^Rn

Die Fehler sind nicht beobachtbar und im Allgemeinen nicht orthogonal zu dem von überspannten Unterraum . Nehmen Sie aus Gründen der Argumentation an, dass der Fehler . Wenn dies wahr wäre, hätten wir mit . Da , könnten wir zerlegen und das wahre .εXεspan(X)y=Xβ+ε=y~+εy~εy~=Xβspan(X)yε

Angenommen, wir haben eine Basis von , wobei der erste Basisvektor den Unterraum überspannt und die verbleibenden span . Im Allgemeinen hat der Fehler Komponenten ungleich Null für . Diese Nicht-Null-Komponenten werden mit und können daher nicht durch Projektion auf wiederhergestellt werden .b1,,bnRnb1,,bkspan(X)bk+1,,bnspan(X)ε=α1b1++αnbnαii{1,,k}Xβspan(X)

Da wir niemals hoffen können, die wahren Fehler wiederherzustellen, sind und korrelierte singuläre dimensionale Normalen, könnten wir transformieren . Dort können wir haben, dass dh ist nicht singulär unkorreliert und homoskedastisch normalverteilt. Die Residuen heißen Theils BLUS-Residuen .εe^ne^RneRnk

eNnk(0,σ2Ink),
ee

In der Kurzarbeit Über das Testen von Regressionsstörungen auf Normalität finden Sie einen Vergleich von OLS- und BLUS-Residuen. In der getesteten Monte-Carlo-Einstellung sind die OLS-Residuen den BLUS-Residuen überlegen. Dies sollte Ihnen jedoch einen Ausgangspunkt geben.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.