Um eine Hauptkomponentenanalyse (PCA) durchzuführen, müssen Sie die Mittelwerte jeder Spalte von den Daten subtrahieren, die Korrelationskoeffizientenmatrix berechnen und dann die Eigenvektoren und Eigenwerte finden. Nun, vielmehr habe ich dies getan, um es in Python zu implementieren, außer dass es nur mit kleinen Matrizen funktioniert, da die Methode zum Ermitteln der Korrelationskoeffizientenmatrix (Corrcoef) es mir nicht erlaubt, ein Array mit hoher Dimensionalität zu verwenden. Da ich es für Bilder verwenden muss, hilft mir meine aktuelle Implementierung nicht wirklich.
Ich habe gelesen, dass es möglich ist, einfach Ihre Datenmatrix und D D ⊤ / n anstelle von D ⊤ D / n zu berechnen , aber das funktioniert bei mir nicht. Nun, ich bin mir nicht ganz sicher, ob ich verstehe, was es bedeutet, abgesehen von der Tatsache, dass es eine n × n- Matrix anstelle von p × p sein soll (in meinem Fall p ≫ n ). Ich habe in den Eigengesichts-Tutorials darüber gelesen, aber keiner von ihnen schien es so zu erklären, dass ich es wirklich verstehen konnte.
Kurz gesagt, gibt es eine einfache algorithmische Beschreibung dieser Methode, damit ich ihr folgen kann?