Als «pca» getaggte Fragen

Die Hauptkomponentenanalyse (PCA) ist eine lineare Dimensionsreduktionstechnik. Es reduziert ein multivariates Dataset auf einen kleineren Satz konstruierter Variablen, wobei so viele Informationen (so viel Varianz) wie möglich erhalten bleiben. Diese Variablen, Hauptkomponenten genannt, sind lineare Kombinationen der Eingangsvariablen.


1
GBM-Paket vs. Caret mit GBM
Ich habe das Modell mit optimiert caret, aber dann das Modell mit dem gbmPaket erneut ausgeführt. Nach meinem Verständnis sollten das verwendete caretPaket gbmund die Ausgabe identisch sein. Nur ein kurzer Testlauf mit data(iris)zeigt jedoch eine Diskrepanz im Modell von etwa 5% unter Verwendung von RMSE und R ^ 2 …


4
PCA-Modellauswahl mit AIC (oder BIC)
Ich möchte das Akaike Information Criterion (AIC) verwenden, um die entsprechende Anzahl von Faktoren auszuwählen, die in einem PCA extrahiert werden sollen. Das einzige Problem ist, dass ich nicht sicher bin, wie ich die Anzahl der Parameter bestimmen soll. Man betrachte eine T×NT×NT\times N Matrix XXX , wobei NNN die …

2
PCA und zufällige Wälder
Für einen kürzlich durchgeführten Kaggle-Wettbewerb habe ich (manuell) 10 zusätzliche Funktionen für mein Trainingsset definiert, die dann zum Trainieren eines zufälligen Waldklassifikators verwendet werden. Ich habe mich entschieden, PCA für das Dataset mit den neuen Funktionen auszuführen, um zu sehen, wie sie miteinander verglichen werden. Ich fand heraus, dass ~ …

5
Kann ich PCA zur Variablenauswahl für die Clusteranalyse verwenden?
Ich muss die Anzahl der Variablen reduzieren, um eine Clusteranalyse durchzuführen. Meine Variablen sind stark korreliert, daher habe ich mir überlegt, eine Faktoranalyse-PCA (Principal Component Analysis) durchzuführen. Wenn ich jedoch die resultierenden Bewertungen verwende, sind meine Cluster nicht ganz korrekt (im Vergleich zu früheren Klassifizierungen in der Literatur). Frage: Kann …

2
Was machen die ersten
Bei der Hauptkomponentenanalyse sind die ersten Hauptkomponenten die kkkkkkk orthogonalen Richtungen mit der maximalen Varianz. Mit anderen Worten, die erste Hauptkomponente wird als Richtung der maximalen Varianz gewählt, die zweite Hauptkomponente wird als Richtung orthogonal zur ersten mit der maximalen Varianz gewählt und so weiter. Gibt es eine ähnliche Interpretation …


1
Unterschied zwischen Scikit-Learn-Implementierungen von PCA und TruncatedSVD
Ich verstehe die Beziehung zwischen Hauptkomponentenanalyse und Singularwertzerlegung auf algebraischer / exakter Ebene. Meine Frage bezieht sich auf die Implementierung von Scikit-Learn . In der Dokumentation heißt es: " [TruncatedSVD] ist PCA sehr ähnlich, arbeitet jedoch direkt mit Stichprobenvektoren anstatt mit einer Kovarianzmatrix. " Dies würde den algebraischen Unterschied zwischen …
12 pca  scikit-learn  svd  scipy 

4
PCA nur mit einer Distanzmatrix durchführen
Ich möchte einen massiven Datensatz gruppieren, für den ich nur die paarweisen Abstände habe. Ich habe einen k-medoids-Algorithmus implementiert, dessen Ausführung jedoch zu lange dauert. Daher möchte ich zunächst die Dimension meines Problems durch Anwendung von PCA reduzieren. Die einzige Möglichkeit, diese Methode durchzuführen, ist die Verwendung der Kovarianzmatrix, die …

2
Sind PCA-Lösungen einzigartig?
Wenn ich PCA für einen bestimmten Datensatz ausführe, ist die mir gegebene Lösung einzigartig? Das heißt, ich erhalte einen Satz von 2D-Koordinaten, basierend auf Zwischenpunktabständen. Ist es möglich, mindestens eine weitere Anordnung der Punkte zu finden, die diese Einschränkungen erfüllen würden? Wenn die Antwort ja ist, wie kann ich eine …
12 pca 

4
Wie wird eine PCA für Daten mit sehr hoher Dimensionalität durchgeführt?
Um eine Hauptkomponentenanalyse (PCA) durchzuführen, müssen Sie die Mittelwerte jeder Spalte von den Daten subtrahieren, die Korrelationskoeffizientenmatrix berechnen und dann die Eigenvektoren und Eigenwerte finden. Nun, vielmehr habe ich dies getan, um es in Python zu implementieren, außer dass es nur mit kleinen Matrizen funktioniert, da die Methode zum Ermitteln …
12 pca  python 

3
Bedeutung von "Rekonstruktionsfehler" in PCA und LDA
Ich implementiere PCA, LDA und Naive Bayes für die Komprimierung bzw. Klassifizierung (Implementierung einer LDA für die Komprimierung und Klassifizierung). Ich habe den Code geschrieben und alles funktioniert. Was ich für den Bericht wissen muss, ist die allgemeine Definition des Rekonstruktionsfehlers . Ich kann viel Mathematik finden und in der …



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.