Als «pca» getaggte Fragen

Die Hauptkomponentenanalyse (PCA) ist eine lineare Dimensionsreduktionstechnik. Es reduziert ein multivariates Dataset auf einen kleineren Satz konstruierter Variablen, wobei so viele Informationen (so viel Varianz) wie möglich erhalten bleiben. Diese Variablen, Hauptkomponenten genannt, sind lineare Kombinationen der Eingangsvariablen.

1
Was sind effiziente Algorithmen zur Berechnung der Singularwertzerlegung (SVD)?
Der Wikipedia-Artikel zur Hauptkomponentenanalyse besagt dies Es gibt effiziente Algorithmen zur Berechnung der SVD von ohne dass die Matrix muss. Daher ist die Berechnung der SVD heute die Standardmethode zur Berechnung einer Hauptkomponentenanalyse aus einer Datenmatrix, sofern nicht nur eine Handvoll Komponenten erforderlich sind.XXXXTXXTXX^TX Könnte mir jemand sagen, um welche …
17 pca  algorithms  svd  numerics 

1
Sind robuste Methoden wirklich besser?
Ich habe zwei Gruppen von Probanden, A und B, jede mit einer Größe von ungefähr 400 und ungefähr 300 Prädiktoren. Mein Ziel ist es, ein Vorhersagemodell für eine binäre Antwortvariable zu erstellen. Mein Kunde möchte das Ergebnis der Anwendung des von A auf B erstellten Modells sehen. (In seinem Buch …


3
Hauptkomponentenanalyse „rückwärts“: Wie viel Varianz der Daten erklärt sich durch eine gegebene Linearkombination der Variablen?
Ich habe eine Hauptkomponentenanalyse von sechs Variablen , , , , und . Wenn ich das richtig verstehe, sagt mir der nicht gedrehte PC1, welche lineare Kombination dieser Variablen die größte Abweichung in den Daten beschreibt / erklärt, und der PC2 sagt mir, welche lineare Kombination dieser Variablen die nächstgrößere …

1
Robuster PCA vs. robuster Mahalanobis-Abstand zur Erkennung von Ausreißern
Robustes PCA (wie von Candes et al. 2009 oder besser Netrepalli et al. 2014 entwickelt ) ist eine beliebte Methode für die multivariate Ausreißererkennung. Aufgrund einer robusten, regulierten Schätzung der Kovarianzmatrix kann der Mahalanobis-Abstand jedoch auch für die Ausreißererkennung verwendet werden . Ich bin neugierig auf die (negativen) Vorteile einer …

1
Was ist das richtige Assoziationsmaß einer Variablen mit einer PCA-Komponente (auf einem Biplot / Ladeplot)?
Ich benutze FactoMineR, um meinen Messdatensatz auf die latenten Variablen zu reduzieren. Die variable Karte oben ist für mich klar zu interpretieren, aber ich bin verwirrt , wenn es um den Zusammenhang zwischen den Variablen und Komponente 1. Mit Blick auf der variablen Karte kommt, ddpund covist sehr nah an …

1
Was sind die Vorteile von Kernel-PCA gegenüber Standard-PCA?
Ich möchte einen Algorithmus in einem Artikel implementieren, der Kernel-SVD zum Zerlegen einer Datenmatrix verwendet. Ich habe also Materialien über Kernelmethoden und Kernel-PCA usw. gelesen. Aber es ist für mich immer noch sehr dunkel, besonders wenn es um mathematische Details geht, und ich habe ein paar Fragen. Warum Kernelmethoden? Oder …
17 pca  svd  kernel-trick 

2
Warum sollten die Daten protokolliert werden, bevor eine Hauptkomponentenanalyse durchgeführt wird?
Ich folge hier einem Tutorial: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/ um ein besseres Verständnis von PCA zu erlangen. Das Lernprogramm verwendet das Iris-Dataset und wendet eine Protokolltransformation vor PCA an: Beachten Sie, dass wir im folgenden Code eine Protokolltransformation auf die kontinuierlichen Variablen anwenden, wie in [1] vorgeschlagen, centerund im Aufruf zum Standardisieren der …

1
Sind PCA-Komponenten multivariater Gauß-Daten statistisch unabhängig?
Sind PCA-Komponenten (in der Hauptkomponentenanalyse) statistisch unabhängig, wenn unsere Daten multivariat normalverteilt sind? Wenn ja, wie kann dies nachgewiesen werden? Ich frage, weil ich diesen Beitrag gesehen habe , in dem in der oberen Antwort steht: PCA geht nicht von einer expliziten Gaußschen Annahme aus. Es werden die Eigenvektoren gefunden, …
16 pca  independence  svd 


2
Wann kombinieren wir Dimensionsreduktion mit Clustering?
Ich versuche, Clustering auf Dokumentebene durchzuführen. Ich habe die Term-Document-Frequenzmatrix konstruiert und versuche, diese hochdimensionalen Vektoren mit k-Mitteln zu clustern. Anstatt direkt zu clustern, habe ich zuerst die LSA-Singularvektorzerlegung (Latent Semantic Analysis) angewendet, um die U, S, Vt-Matrizen zu erhalten, eine geeignete Schwelle unter Verwendung des Geröllplots ausgewählt und Clusterbildung …

2
Bewertung der Zuverlässigkeit eines Fragebogens: Dimensionalität, problematische Elemente und Verwendung von Alpha, Lambda6 oder einem anderen Index?
Ich analysiere die Ergebnisse von Teilnehmern, die an einem Experiment teilgenommen haben. Ich möchte die Zuverlässigkeit meines Fragebogens einschätzen, der sich aus 6 Elementen zusammensetzt, um die Einstellung der Teilnehmer zu einem Produkt einzuschätzen. Ich habe Cronbachs Alpha berechnet, indem ich alle Elemente als eine einzige Skala (Alpha war ungefähr …

3
Interpretation der PCA-Ergebnisse
Kann mir jemand bei der Interpretation von PCA-Scores helfen? Meine Daten stammen aus einem Fragebogen zur Einstellung gegenüber Bären. Nach den Ladungen habe ich eine meiner Hauptkomponenten als "Angst vor Bären" interpretiert. Würden sich die Bewertungen dieser Hauptkomponente darauf beziehen, wie jeder Befragte diese Hauptkomponente bewertet (ob er / sie …
16 pca 

1
Was ist der Zusammenhang zwischen partiellen kleinsten Quadraten, reduzierter Rangregression und Hauptkomponentenregression?
Sind reduzierte Rangregression und Hauptkomponentenregression nur Sonderfälle von partiellen kleinsten Quadraten? In diesem Lernprogramm (Seite 6, "Objektivvergleich") wird angegeben, dass bei Teilquadraten ohne X- oder Y-Projektion (dh "nicht partiell") die Rang- oder Hauptkomponentenregression entsprechend verringert wird. Eine ähnliche Erklärung finden Sie auf dieser SAS-Dokumentationsseite in den Abschnitten "Reduzierte Rangregression" und …

2
PCA und k-fache Kreuzvalidierung in Caret-Packung in R
Ich habe mir gerade einen Vortrag aus dem Kurs über maschinelles Lernen auf Coursera noch einmal angesehen. In dem Abschnitt, in dem der Professor PCA für die Vorverarbeitung von Daten in beaufsichtigten Lernanwendungen bespricht, sagt er, dass PCA nur für die Trainingsdaten durchgeführt werden sollte und dann das Mapping verwendet …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.