Ohne zu versuchen, auf PCA einen vollständigen Primer zu geben, ist vom Standpunkt der Optimierung die primäre Zielfunktion der Rayleigh-Quotient . Die im Quotienten angegebene Matrix ist (ein Vielfaches davon) die Beispiel-Kovarianzmatrix
wobei jedes ein Vektor von Merkmalen ist und die Matrix ist, so dass die te Zeile .
S=1n∑i=1nxixTi=XTX/n
xipXixTi
PCA versucht, eine Folge von Optimierungsproblemen zu lösen. Das erste in der Sequenz ist das uneingeschränkte Problem
maximizeuTSuuTu,u∈Rp.
Daist das obige uneingeschränkte Problem gleichbedeutend mit dem eingeschränkten Problem
uTu=∥u∥22=∥u∥∥u∥
maximizesubject touTSuuTu=1.
Hier kommt die Matrixalgebra ins Spiel. Da eine symmetrisch positive semidefinite Matrix ist (konstruktionsbedingt!), Hat sie eine Eigenwertzerlegung der Form
wobei eine ist orthogonale Matrix (also ) und ist eine diagonale Matrix mit nichtnegativen Einträgen so dass .S
S=QΛQT,
QQQT=IΛλiλ1≥λ2≥⋯≥λp≥0
Daher ist . Da im Problem auf eine Norm von eins beschränkt ist, gilt dies auch für da , da orthogonal ist.uTSu=uTQΛQTu=wTΛw=∑pi=1λiw2iuw∥w∥2=∥QTu∥2=∥u∥2=1Q
Aber wenn wir die Menge unter den Bedingungen , dann ist das Beste, was wir tun können, zu setze , und für .∑pi=1λiw2i∑pi=1w2i=1w=e1w1=1wi=0i>1
Wenn wir nun das entsprechende , nach dem wir zuerst gesucht haben, erhalten wir Folgendes:
wobei bezeichnet die erste Spalte von , dh den Eigenvektor, der dem größten Eigenwert von . Der Wert der Zielfunktion wird dann auch leicht als .u
u⋆=Qe1=q1
q1QSλ1
Die verbleibenden Hauptkomponentenvektoren werden dann durch Lösen der mit indizierten Folge von Optimierungsproblemen gefunden.
Das Problem ist also dasselbe, außer dass wir die zusätzliche Einschränkung hinzufügen, dass die Lösung zu allen vorherigen Lösungen in der Sequenz orthogonal sein muss . Es ist nicht schwierig , das Argument oben induktiv zu zeigen , zu verlängern , dass die Lösung der - ten Problem ist in der Tat , der - te Eigenvektor .i
maximizesubject touTiSuiuTiui=1uTiuj=0∀1≤j<i.
iqiiS
Die PCA-Lösung wird häufig auch als Singularwertzerlegung von ausgedrückt . Um zu sehen , warum, lassen . Dann ist und so (Streng genommen bis zum Signieren von Flips) und .XX=UDVTnS=XTX=VD2VTV=QΛ=D2/n
Die Hauptkomponenten werden durch Projizieren von auf die Hauptkomponentenvektoren gefunden. Aus der gerade gegebenen SVD-Formulierung ist leicht ersichtlich, dass
X
XQ=XV=UDVTV=UD.
Die Einfachheit der Darstellung sowohl der Hauptkomponentenvektoren als auch der Hauptkomponenten selbst in Bezug auf die SVD der Merkmalsmatrix ist ein Grund, warum die SVD bei einigen Behandlungen von PCA so prominent ist.