Robustes PCA (wie von Candes et al. 2009 oder besser Netrepalli et al. 2014 entwickelt ) ist eine beliebte Methode für die multivariate Ausreißererkennung. Aufgrund einer robusten, regulierten Schätzung der Kovarianzmatrix kann der Mahalanobis-Abstand jedoch auch für die Ausreißererkennung verwendet werden . Ich bin neugierig auf die (negativen) Vorteile einer Methode gegenüber der anderen.
Meine Intuition sagt mir, dass der größte Unterschied zwischen den beiden folgenden ist: Wenn der Datensatz "klein" (im statistischen Sinne) ist, ergibt eine robuste PCA eine niedrigere Kovarianz, während eine robuste Kovarianzmatrixschätzung stattdessen eine vollständige Kovarianzmatrixschätzung ergibt. Rang Kovarianz aufgrund der Ledoit-Wolf Regularisierung. Wie wirkt sich dies wiederum auf die Erkennung von Ausreißern aus?