Es gibt viele Beiträge zu dieser SE, in denen robuste Ansätze für die Hauptkomponentenanalyse (PCA) erörtert werden, aber ich kann keine gute Erklärung dafür finden, warum PCA überhaupt empfindlich gegenüber Ausreißern ist.
Es gibt viele Beiträge zu dieser SE, in denen robuste Ansätze für die Hauptkomponentenanalyse (PCA) erörtert werden, aber ich kann keine gute Erklärung dafür finden, warum PCA überhaupt empfindlich gegenüber Ausreißern ist.
Antworten:
Einer der Gründe ist, dass PCA als eine niedrigrangige Zerlegung der Daten angesehen werden kann, die die Summe der -Normen der Reste der Zerlegung minimiert . Das heißt , wenn ist , die Daten ( Vektoren von Dimensionen), und ist die PCA - Basis ( Vektoren von Dimensionen), dann wird die Zersetzung streng minimiert
Da die PCA die -Normen (dh quadratische Normen) minimiert, gibt es die gleichen Probleme wie bei den kleinsten Quadraten oder bei der Anpassung eines Gaußschen durch Empfindlichkeit gegenüber Ausreißern. Aufgrund der Quadratur der Abweichungen von den Ausreißern dominieren sie die Gesamtnorm und steuern daher die PCA-Komponenten.