Ich habe vor einigen Vorlesungen im Unterricht etwas über PCA gelernt, und als ich mehr über dieses faszinierende Konzept erfuhr, lernte ich etwas über spärliche PCA.
Ich wollte fragen, ob ich mich nicht irre: Wenn Sie in PCA Datenpunkte mit p Variablen haben, können Sie jeden Datenpunkt im p- dimensionalen Raum darstellen, bevor Sie PCA anwenden. Nach dem Anwenden von PCA können Sie es wieder im selben dimensionalen Raum darstellen, aber dieses Mal enthält die erste Hauptkomponente die größte Varianz, die zweite die zweitgrößte Varianzrichtung und so weiter. So können Sie die letzten Hauptkomponenten eliminieren, da sie keinen großen Datenverlust verursachen, und Sie können die Daten komprimieren. Recht?
Sparse PCA wählt Hauptkomponenten so aus, dass diese Komponenten in ihren Vektorkoeffizienten weniger Nicht-Null-Werte enthalten.
Wie soll Ihnen das helfen, Daten besser zu interpretieren? Kann jemand ein Beispiel geben?