Wie kombiniere ich PCA und MCA mit gemischten Daten?


9

Angenommen, ich habe gemischte Daten und (Python-) Code, der PCA (Hauptkomponentenanalyse) für kontinuierliche Prädiktoren und MCA (Multiple Correspondence Analysis) für nominale Prädiktoren ausführen kann. Ist es möglich, Ergebnisse von PCA und MCA in einem zu kombinieren?

Antworten:


8

Möglicherweise möchten Sie die Faktoranalyse gemischter Daten verwenden .

Sie können damit die Dimensionsreduzierung für einen vollständigen Datensatz durchführen.

Die AR-Implementierung finden Sie im FactoMineR-Paket. Diese Funktion hat jedoch Probleme, wenn Sie eine hohe Anzahl von Daten / Spalten haben.

Mir ist die Existenz des Äquivalents in Python nicht bekannt.


Vielen Dank, ich habe bereits über FAMD gelesen, das leider nur R-Unterstützung zu haben scheint - daher meine Frage. Das Mindeste, was ich jetzt tun kann, ist, die Ergebnisse beider Methoden (PCA & MCA) getrennt zu behandeln. Wenn es jedoch eine Möglichkeit gibt, sie zu einem monolithischen Datensatz zu mischen, ist dies die Antwort, nach der ich suche.
Wojciech Migda

Ok, es stellte sich heraus, dass mein Dataset groß genug ist, um der vorliegenden MCA-Implementierung den Speicherplatz zu verlieren.
Wojciech Migda

Dies ist ein wiederkehrendes Problem, das ich bei der R-Implementierung bekomme. Wenn Sie nur eine begrenzte Anzahl von Variablen haben, versuchen Sie, Ihre Beobachtungen zu gewichten. Oder verwenden Sie nur einen Teil Ihrer Beobachtung. Andernfalls könnten Sie versuchen, Ihre numerische Variable in eine Ordnungskategorie oder Ihre qualitativen Variablen in Flags umzuwandeln.
YCR


1

Ich habe in Python nach dem gleichen gesucht und bin auf das Prince- Paket gekommen, das FAMD implementiert hat.


1

Ich habe nicht genug Punkte, um einen Kommentar abzugeben. Wenn ich hier antworte, enthält @Edo prince Package nur CA-, MCA- und PCA-PAckages. Ich sehe hier keine FAMD.

dir(prince)

['CA', 'MCA', 'PCA', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '__version__', 'ca', 'mca', 'pca', 'plot', 'svd']

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.