Warum Spur von


13

Im Modell y=Xβ+ϵ können wir β mit der Normalgleichung :abschätzen.

β^=(XX)1Xy,
und wir konnten erhalten y =X β .
y^=Xβ^.

Der Vektor der Residuen wird geschätzt durch

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ,

wobei

Q=IX(XX)1X.

Meine Frage ist, wie man die Schlussfolgerung von tr ( Q ) = n - p erhält .

tr(Q)=np.

Antworten:


12

Die Schlussfolgerung zählt nur die Dimensionen der Vektorräume. Dies ist jedoch im Allgemeinen nicht der Fall.

Die grundlegendsten Eigenschaften der Matrixmultiplikation zeigen, dass die durch die Matrix lineare Transformation H=X(XX)Xerfüllt ist

H2=(X(XX)X)2=X(XX)(XX)(XX)X=H,

es als Projektionsoperator ausstellen . Daher seine Ergänzung

Q=1H

(wie in der Frage angegeben) ist auch ein Projektionsoperator. Die Spur von ist ihr Rang h (siehe unten), von wo aus die Spur von Q gleich n - h istHhQnh .

Aus seiner Formel geht hervor, dass die Matrix ist, die mit der Zusammensetzung zweier linearer Transformationen J = ( X ' X ) - X ' und X selbst verbunden ist. Die erste ( J ) wandelt die n -Vektor y in die p -vector β . Das zweite ( X ) ist eine Umwandlung von R p bis R n gegeben durch Y = X βH

J=(XX)X
XJnypβ^XRpRny^=Xβ^. Sein Rang kann den kleineren dieser beiden Dimensionen nicht überschreiten, der in einer Einstellung der kleinsten Quadrate immer (aber kleiner als p sein kann , wenn J nicht den vollen Rang hat). Folglich kann der Rang der Zusammensetzung H = X J den Rang von X nicht überschreiten . Die richtige Schlussfolgerung lautet alsoppJH=XJX

genau dann, wenn J den vollen Rang hat; und im Allgemeinen ist n tr ( Q ) n - p . Im ersteren Fall soll das Modell "identifizierbar" sein (für die Koeffizienten von β ).tr(Q)=npJntr(Q)npβ

hat genau dann den vollen Rang, wenn X ' X invertierbar ist.JXX


Geometrische Interpretation

stellt die orthogonale Projektion von n- Vektoren y (die "Antwort" oder "abhängige Variable" darstellen) auf den Raum dar, der von den Spalten von X überspannt wird(die "unabhängigen Variablen" oder "Kovariaten" darstellen). Die Differenz Q = 1 - H zeigt, wie man einen beliebigen n- Vektor y in eine Summe von Vektoren y = H ( y ) + Q ( y ) zerlegt , wobei der erste von X "vorhergesagt" werden kannund der zweite senkrecht dazu ist . Wenn der pHnyXQ=1Hny

y=H(y)+Q(y),
XpSpalten von erzeugen einen p- dimensionalen Raum (das heißt, sie sind nicht kollinear), der Rang von H ist p und der Rang von Q ist n - p , was die n - p zusätzlichen Variationsdimensionen in der Antwort widerspiegelt , die nicht dargestellt sind innerhalb der unabhängigen Variablen. Die Kurve gibt eine algebraische Formel für diese Dimensionen an.XpHpQnpnp

Lineare Algebra Hintergrund

Ein Projektionsoperator auf einem Vektorraum (wie beispielsweise R n ) eine lineare Transformation P : V V (das heißt, ein endomorphism von V ) , so daß P 2 = P . Dies macht sein Komplement Q = 1 - P auch zu einem Projektionsoperator, weilVRnP:VVVP2=PQ=1P

Q2=(1P)2=12P+P2=12P+P=Q.

Alle Projektionen fixieren jedes Element ihrer Bilder, denn wann immer , können wir v = P ( w ) für einige w V schreiben , woraus w = P ( v ) = P 2 ( v ) = P ( P ( v ) ) = P ( w ) .vIm(P)v=P(w)wV

w=P(v)=P2(v)=P(P(v))=P(w).

Jedem Endomorphismus von V sind zwei Unterräume zugeordnet: sein Kernel- Ker ( P ) = { v vPV und seinBild Im ( P ) = { v v

ker(P)={vv|P(v)=0}
Jeder Vektor v V kann in der Form v = w + u geschrieben werden, wobei w Im ( P ) und u Ker ( P ) . Wir können daher eine Basis E F für V konstruieren,für die E Ker ( P ) und F Im
Im(P)={vv|wVP(w)=v}.
vV
v=w+u
wIm(P)uKer(P)EFVEKer(P) . Wenn V endlichdimensional ist, liegt die Matrix von P auf dieser Basis daher in blockdiagonaler Form vor, wobei ein Block (entsprechend der Wirkung von P auf E ) alle Nullen und der andere (entsprechend der Wirkung von P auf F) )gleich den f durch f Identitätsmatrix, wobei die Dimension F ist f . Die Spur von P ist die Summe der Werte auf der Diagonale und muss daher gleich f × 1 = f sein . Diese Zahl ist derRangvonFIm(P)VPPEPFffFfPf×1=f : die Dimension seines Bildes.P

Die Spur die Spur ist gleich 1 (entspricht n , die Abmessung V ) minus der Spur von P .1P1nVP

Diese Ergebnisse können mit der Behauptung zusammengefasst werden, dass die Spur einer Projektion ihrem Rang entspricht.


Vielen Dank. Ich habe aus Ihrer Antwort viel erweitertes Wissen gelernt.
Zhushun0008

19

@Dougal hat bereits eine Antwort gegeben, aber hier ist eine andere, etwas einfacher.

tr(AB)=tr(A)tr(B)

tr(Q)=tr(I)tr(X(XX)1X).
In×ntr(I)=ntr(AB)=tr(BA)
tr(Q)=ntr((XX)1(XX)).
(XX)1(XX)p×pp
tr(Q)=np.

6

npX vollen Rang hat.

X=UΣVTΣRp×p is diagonal and URn×p,VRp×p have UTU=VTV=VVT=Ip (but note UUT is rank at most p so it cannot be In). Then

X(XTX)1XT=UΣVT(VΣUTUΣVT)1VΣUT=UΣVT(VΣ2VT)1VΣUT=UΣVTVΣ2VTVΣUT=UUT.

Now, there exists a matrix U2Rn×np such that Un=[UU2] is unitary. We can write

IX(XTX)1XT=UnUnTUUT=Un(In[Ip000])UnT=Un[000Inp]UnT.
This form shows that Q is positive semidefinite, and since it is a valid svd and the singular values are the square of the eigenvalues for a square symmetric matrix, also tells us that Q has eigenvalues 1 (of multiplicity np) and 0 (of multiplicity p). Thus the trace of Q is np.
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.