Im Fall der PCA „Varianz“ bedeutet summative Varianz oder multivariate Variabilität oder Gesamtvariabilität oder Gesamtvariabilität . Unten sehen Sie die Kovarianzmatrix von 3 Variablen. Ihre Varianzen liegen auf der Diagonale und die Summe der 3 Werte (3.448) ist die Gesamtvariabilität.
1.343730519 -.160152268 .186470243
-.160152268 .619205620 -.126684273
.186470243 -.126684273 1.485549631
Jetzt ersetzt PCA die ursprünglichen Variablen durch neue Variablen, die als Hauptkomponenten bezeichnet werden. Sie sind orthogonal (dh sie haben keine Kovariationen) und haben Varianzen (sogenannte Eigenwerte) in absteigender Reihenfolge. Die Kovarianzmatrix zwischen den aus den obigen Daten extrahierten Hauptkomponenten lautet also:
1.651354285 .000000000 .000000000
.000000000 1.220288343 .000000000
.000000000 .000000000 .576843142
Beachten Sie, dass die Diagonalsumme immer noch 3,448 beträgt, was besagt, dass alle 3 Komponenten für die multivariate Variabilität verantwortlich sind. Die 1. Hauptkomponente macht 1,651 / 3,448 = 47,9% der Gesamtvariabilität aus oder "erklärt" sie; der 2. erklärt 1.220 / 3.448 = 35,4% davon; der dritte erklärt .577 / 3.448 = 16,7% davon.
Was bedeuten sie also, wenn sie sagen, dass " PCA die Varianz maximiert " oder " PCA die maximale Varianz erklärt "? Das heißt natürlich nicht, dass es die größte Varianz unter drei Werten findet 1.343730519 .619205620 1.485549631
, nein. PCA findet, im Datenraum, die Dimension (Richtung) mit der größten Abweichung von der Gesamtvarianz 1.343730519+.619205620+1.485549631 = 3.448
. Diese größte Varianz wäre 1.651354285
. Dann wird aus der verbleibenden 3.448-1.651354285
Gesamtvarianz die Dimension der zweitgrößten, orthogonal zur ersten Varianz ermittelt. Diese 2. Dimension wäre 1.220288343
Varianz. Und so weiter. Die letzte verbleibende Dimension ist die .576843142
Varianz. Siehe auch "Pt3" hier und die tolle Antwort hier Erklären, wie es im Detail gemacht wurde.
Mathematisch wird PCA über lineare Algebra-Funktionen ausgeführt, die als Eigenzerlegung oder Svd-Zerlegung bezeichnet werden. Diese Funktionen geben alle Eigenwerte 1.651354285 1.220288343 .576843142
(und die entsprechenden Eigenvektoren) auf einmal zurück ( siehe , siehe ).