Ich habe ein paar kurze Fragen zu PCA:
- Geht die PCA davon aus, dass der Datensatz Gaußsch ist?
- Was passiert, wenn ich eine PCA auf inhärent nichtlineare Daten anwende?
Bei einem gegebenen Datensatz besteht der Prozess darin, zunächst die Mittelwerte zu normalisieren, die Varianz auf 1 zu setzen, eine SVD zu nehmen, den Rang zu verringern und den Datensatz schließlich dem neuen Raum mit dem reduzierten Rang zuzuordnen. Im neuen Raum entspricht jede Dimension einer "Richtung" maximaler Varianz.
- Aber ist die Korrelation dieses Datensatzes im neuen Raum immer Null, oder gilt das nur für Daten, die von Natur aus Gauß'sch sind?
Angenommen, ich habe zwei Datensätze, "A" und "B", wobei "A" zufällig ausgewählten Punkten aus einer Gaußschen Verteilung entspricht, während "B" zufällig ausgewählten Punkten aus einer anderen Verteilung entspricht (z. B. Poisson).
- Wie vergleicht sich die PCA (A) mit der PCA (B)?
- Wie kann ich durch Betrachten der Punkte im neuen Raum feststellen, dass die PCA (A) Punkten entspricht, die von einem Gaußschen abgetastet wurden, während die PCA (B) Punkten entsprechen, die von einem Poisson abgetastet wurden?
- Entspricht die Korrelation der Punkte in "A" 0?
- Ist die Punktkorrelation in "B" auch 0?
- Noch wichtiger ist, stelle ich die "richtige" Frage?
- Soll ich mir die Korrelation ansehen, oder gibt es eine andere Metrik, die ich berücksichtigen sollte?