Überlegen Sie, was PCA macht. Einfach ausgedrückt, PCA (wie am häufigsten ausgeführt) erstellt ein neues Koordinatensystem durch:
- Verlagerung des Ursprungs auf den Schwerpunkt Ihrer Daten,
- drückt und / oder streckt die Achsen, um sie gleich lang zu machen, und
- Dreht Ihre Achsen in eine neue Ausrichtung.
(Weitere Informationen finden Sie in diesem hervorragenden CV-Thread: Machen Sie Sinn mit der Analyse von Hauptkomponenten, Eigenvektoren und Eigenwerten .) Es dreht jedoch nicht nur Ihre Achsen auf irgendeine Weise. Ihr neues (die erste Hauptkomponente) ist auf die maximale Variationsrichtung Ihrer Daten ausgerichtet. Die zweite Hauptkomponente ist in der Richtung der nächstgrößeren Variationsgröße ausgerichtet , die orthogonal zur ersten Hauptkomponente ist . Die übrigen Hauptkomponenten werden ebenfalls gebildet. X1
Schauen wir uns in diesem Sinne das Beispiel von @ amoeba an . Hier ist eine Datenmatrix mit zwei Punkten in einem dreidimensionalen Raum:
Sehen wir uns diese Punkte in einem (pseudo-) dreidimensionalen Streudiagramm an:
X=[121212]
(1.5,1.5,1.5)(0,0,0)(3,3,3)(0,0,3)(3,3,0)(0,3,0)(3,0,3)
N=2N−1=1