Wie finde ich die Varianz zwischen mehrdimensionalen Punkten?


12

Angenommen, ich habe eine Matrix X, die n mal p ist, dh n Beobachtungen mit jeder Beobachtung im p-dimensionalen Raum.

Wie finde ich die Varianz dieser n Beobachtungen?

In dem Fall, in dem p = 1 ist, muss ich nur die reguläre Varianzformel verwenden. Was ist mit den Fällen, in denen p> 1 ist?

Antworten:


18

pX=(X1,,Xp)

Var(X)=E[(XEX)(XEX)]=(Var(X1)Cov(X1,Xp)Cov(Xp,X1)Var(Xp))

Das heißt, die Varianz eines Zufallsvektors ist definiert als die Matrix, die alle Varianzen auf der Hauptdiagonale und die Kovarianzen zwischen den verschiedenen Komponenten in den anderen Elementen speichert. Die Stichproben- Kovarianzmatrix würde dann berechnet, indem die Stichprobenanaloga für die Populationsvariablen eingesteckt werden:p×p

1n1(i=1n(Xi1X¯1)2i=1n(Xi1X¯1)(XipX¯p)i=1n(XipX¯p)(Xi1X¯1)i=1n(XipX¯p)2)
wobei bezeichnet die te Beobachtung für Merkmal und den Stichprobenmittelwert vonXijijX¯jjth Funktion. Zusammenfassend ist die Varianz eines Zufallsvektors als die Matrix definiert, die die einzelnen Varianzen und Kovarianzen enthält. Es reicht daher aus, die Stichprobenvarianzen und Kovarianzen für alle Vektorkomponenten einzeln zu berechnen.
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.