Multivariate Normalverteilung des Regressionskoeffizienten?


12

Beim Lesen eines Lehrbuchs über Regression stieß ich auf folgenden Absatz:

Die Schätzung der kleinsten Quadrate eines Vektors linearer Regressionskoeffizienten ( ) istβ

β^=(XtX)1Xty

Dies ist, wenn es als Funktion der Daten (unter Berücksichtigung der Prädiktoren X als Konstanten), eine lineare Kombination der Daten. Mit dem zentralen Grenzwertsatz kann gezeigt werden, dass die Verteilung von βyXβ ungefähr multivariat normal ist, wenn die Stichprobengröße groß ist.

Ich vermisse definitiv etwas im Text, aber ich verstehe nicht, wie ein einzelner Wert eine Verteilung haben kann? Wie werden die mehreren β- Werte generiert, um die im Text angegebene Verteilung zu erhalten?ββ


4
ist der Vektor der Regressionskoeffizienten - klärt das die Verwirrung auf? β
Makro

5
Wenn Sie den Ansatz der kleinsten Quadrate verwenden, nehmen Sie an, dass fest, aber unbekannt ist. Allerdings β , da es sich um eine Funktion der (zufällig) Daten ist, hat eine Verteilung. Asymptotisch ist die Verteilung eine Normalverteilung. Nicht asymptotisch wird ein einzelner Koeffizient verteilt. ββ^
Taylor

7
Es kann hilfreich sein zu beobachten, dass als konstante Matrix in der Regressionseinstellung betrachtet wird und dass y die Realisierung einer (vektorwertigen) Zufallsvariablen ist. Das bisschen über die CLT ist jedoch nicht ganz richtig: Sie beruht entweder darauf, dass H eine bestimmte Struktur hat, die manchmal selbst bei großen Datenmengen nicht tatsächlich auftritt, oder dass y selbst multivariat normal ist (aber dann besteht keine Notwendigkeit dazu CLT aufrufen). H.=(X.tX.)- -1X.tyH.y
whuber

@ Taylor Aber woher kennst du die Verteilung von B, wenn ich nur weiß, dass die "Stichprobengröße groß ist"?
bis

2
@Taylor Die einzelne Komponente des Beta-Vaktors wird nur dann verteilt, wenn die Fehlerkomponente im Regressionsmodell Gauß mit 0 Mittelwert und konstanter Varianz ist. Im nicht normalen Fall würden Sie seine Verteilung unter der Nullhypothese nicht unbedingt kennen, aber es kann immer noch asymptotisch normal sein. Wie Whuber jedoch feststellt, gilt der zentrale Grenzwertsatz möglicherweise nicht, da es sich um einen gewichteten Durchschnitt handelt und wir wissen müssen, dass die Gewichte nicht so mit der Stichprobengröße übereinstimmen, dass einige Terme die Summe dominieren können.
Michael R. Chernick

Antworten:


5

Nicht β hat aber eine verteilung β^, wie von Taylor angegeben. Die Verteilung vonβ^ ergibt sich aus der Tatsache, dass Sie anders werden β^ für verschiedene Stichproben .--- Sie können diese Verteilung basierend auf der einzelnen schätzen β^ Sie erhalten von Ihrer Einzelprobe unter der Bedingung, dass Sie Informationen zur Verteilung der zugrunde liegenden Daten haben.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.