Der PCA-Algorithmus kann anhand der Korrelationsmatrix formuliert werden (vorausgesetzt, die Daten bereits normalisiert und es wird nur die Projektion auf den ersten PC in Betracht gezogen). Die Zielfunktion kann wie folgt geschrieben werden:
Dies ist in Ordnung, und wir verwenden Lagrange-Multiplikatoren, um es zu lösen, dh umzuschreiben als:
das ist äquivalent zu
und daher ( siehe hier auf Mathworld ) scheint
Dies bedeutet jedoch, dass der Abstand zwischen Punkt und Linie maximiert werden soll, und nach dem, was ich hier gelesen habe , ist dies falsch - es sollte , nicht . Wo ist mein Fehler?
Oder kann mir jemand den Zusammenhang zwischen der Maximierung der Varianz im projizierten Raum und der Minimierung des Abstands zwischen Punkt und Linie zeigen?