Ich habe einen Klassifikator, für den ich eine Kreuzvalidierung durchführe, und ungefähr hundert Features, für die ich eine Vorauswahl vornehme, um optimale Kombinationen von Features zu finden. Ich vergleiche dies auch mit der Durchführung der gleichen Experimente mit PCA, bei denen ich die potenziellen Merkmale nehme, SVD anwende, die ursprünglichen Signale in den neuen Koordinatenraum transformiere und die Top- Merkmale in meinem Vorwärtsauswahlprozess verwende.
Meine Intuition war, dass PCA die Ergebnisse verbessern würde, da die Signale "informativer" wären als die ursprünglichen Merkmale. Führt mich mein naives Verständnis von PCA in Schwierigkeiten? Kann jemand einige der häufigsten Gründe dafür nennen, warum PCA die Ergebnisse in bestimmten Situationen verbessern, in anderen Situationen jedoch verschlechtern kann?