Der Artikel nahm in der Definition niemals Homoskadastizität an. Um es in den Kontext des Artikels zu stellen, würde Homoskedastizität sagen,
wobei die Identitätsmatrix ist und ist skalare positive Zahl. Heteroskadastizität ermöglicht
E{(x^−x)(x^−x)T}=σI
In×nσ
E{(x^−x)(x^−x)T}=D
Jedes Diaganol positiv positiv. Der Artikel definiert die Kovarianzmatrix so allgemein wie möglich als das zentrierte zweite Moment einer impliziten Multi-Variate-Verteilung. Wir müssen die multivariate Verteilung von , um eine asymptotisch effiziente und konsistente Schätzung von . Dies wird von einer Wahrscheinlichkeitsfunktion herrühren (die ein obligatorischer Bestandteil des Seitenzahns ist). wir zum Beispiel (dh . Dann ist die implizite Wahrscheinlichkeitsfunktion
Wobei das multivariate normale PDF ist.Dex^e∼N(0,Σ)E{(x^−x)(x^−x)T}=Σ
log[L]=log[ϕ(x^−x,Σ)]
ϕ
Die Fischerinformationsmatrix kann geschrieben werden als
Sie unter en.wikipedia.org/wiki/Fisher_information. Von hier aus können wir ableiten.
Das Obige verwendet eine quadratische Verlustfunktion, geht jedoch nicht davon aus Homoskedastizität.
I(x)=E[(∂∂xlog[L])2∣∣∣x]
n−−√(x^−x)→dN(0,I−1(x))
Im Kontext von OLS, wo wir auf zurückführen, nehmen wir
Die implizierte Wahrscheinlichkeit ist
Dies kann bequem als das univariate normale PDF umgeschrieben werden
. Die Fischerinformation ist dann
yx
E{y|x}=x′β
log[L]=log[ϕ(y−x′β,σI)]
log[L]=∑i=1nlog[φ(y−x′β,σ)]
φI(β)=[σ(xx′)−1]−1
Wenn die Homoskedastizität nicht erfüllt ist, werden die angegebenen Fisher-Informationen falsch angegeben (aber die bedingte Erwartungsfunktion ist immer noch korrekt), sodass die Schätzungen von konsistent, aber ineffizient sind. Wir könnten die Wahrscheinlichkeit, Heteroskaktizität zu berücksichtigen, umschreiben und die Regression ist effizient, dh wir können schreiben.
Dies entspricht bestimmten Formen von verallgemeinerten kleinsten Quadraten , wie z. B. gewichtete kleinste Quadrate. Dies wird jedochlog [ L ] = log [ ϕ ( y - x ' β , D ) ] β 1β
log[L]=log[ϕ(y−x′β,D)]
Ändern Sie die Fisher-Informationsmatrix. In der Praxis kennen wir die Form der Heteroskedastizität oft nicht, daher ziehen wir es manchmal vor, die Ineffizienz zu akzeptieren, anstatt die Regression zufällig zu beeinflussen, indem wir keine Gewichtungsschemata angeben. In solchen Fällen ist die asymptotische Kovarianz ist
nicht , wie oben spezifiziert.
β 1nI−1(β)