Ich weiß, dass das PCA-Ziel darin besteht, die Dimensionalität zu reduzieren
Dies wird oft angenommen, aber tatsächlich ist PCA nur eine Darstellung Ihrer Daten auf orthogonaler Basis. Diese Basis hat immer noch die gleiche Dimension wie Ihre Originaldaten. Nichts ist verloren ... noch nicht. Der Teil zur Reduzierung der Dimensionalität liegt ganz bei Ihnen. PCA stellt sicher, dass die oberen Dimensionen Ihrer neuen Projektion die besten Dimensionen sind, als die Ihre Daten möglicherweise dargestellt werden könnten. Was bedeutet am besten? Hier kommt die erklärte Varianz ins Spiel.kk k
offensichtlich nicht in diesem Fall
Da wäre ich mir nicht so sicher! In Ihrem zweiten Diagramm sieht es so aus, als könnten viele Informationen aus Ihren Daten auf eine horizontale Linie projiziert werden. Das ist 1 Dimension anstelle der ursprünglichen Handlung, die in 2 Dimensionen war! Natürlich verlieren Sie einige Informationen, weil Sie die Y-Achse entfernen, aber ob dieser Informationsverlust für Sie akzeptabel ist, ist Ihr Anruf.
Es gibt eine Menge Fragen zu PCA auf der Website. Ich empfehle Ihnen daher, diese hier , hier , hier oder hier zu prüfen . Wenn Sie danach weitere Fragen haben, posten Sie diese bitte und ich helfe Ihnen gerne weiter.
Als Ihre eigentliche Frage:
Was ist die Geschichte, die Sie über die Temperatur im Vergleich zum Eis in der PCA-Handlung erzählen können?
Da die neuen Koordinatenachsen eine lineare Kombination der ursprünglichen Koordinaten sind, dann ... im Grunde nichts! PCA gibt Ihnen eine Antwort wie (Zahlen erfunden):
P C 1P C 2= 2,5 × Eis - 3,6 × Temperatur= - 1,5 × Eis + 0,6 × Temperatur
Ist das nützlich für dich? Vielleicht. Aber ich würde nicht raten :)
Bearbeitet
Ich werde diese Ressource hinzufügen , die ich für hilfreich halte, da interaktive Diagramme cool sind.
Erneut bearbeitet
Um zu klären, was am besten bedeutet:k
PCA versucht, die Dimensionen zu finden, die die höchste Varianz ergeben, wenn die Daten auf sie projiziert werden. Angenommen, Ihre Daten haben Dimensionen, erklären die ersten PCs mehr Varianz in Ihren Daten als alle anderen Dimensionen. Das meine ich mit best . Ob das für Sie nützlich ist oder nicht, ist eine andere Sache.k k kn > kkk k