Es scheint mir, dass die Hauptfunktion von PCP darin besteht, homogene Gruppen von Individuen oder umgekehrt (im dualen Raum, analog zu PCA) spezifische Assoziationsmuster für verschiedene Variablen hervorzuheben. Es wird eine effektive grafische Zusammenfassung eines multivariaten Datensatzes erstellt, wenn nicht zu viele Variablen vorhanden sind. Variablen werden automatisch auf einen festen Bereich skaliert (normalerweise 0–1), der dem Arbeiten mit standardisierten Variablen entspricht (um den Einfluss einer Variablen auf die anderen aufgrund von Skalierungsproblemen zu verhindern), aber für sehr hochdimensionale Datensätze (# Bei Variablen> 10) müssen Sie sich unbedingt andere Anzeigen ansehen, z. B. Fluktuationsdiagramm oder Heatmap, wie sie in Microarray-Studien verwendet werden.
Es hilft bei der Beantwortung von Fragen wie:
- Gibt es ein konsistentes Muster von Einzelbewertungen, das durch eine bestimmte Klassenzugehörigkeit erklärt werden kann (z. B. geschlechtsspezifische Unterschiede)?
- Gibt es eine systematische Kovariation zwischen den bei zwei oder mehr Variablen beobachteten Bewertungen (z. B. niedrige bei Variablen beobachtete Bewertungen)? X1 ist immer mit Highscores verbunden X2)?
In der folgenden Darstellung der Irisdaten ist deutlich zu sehen, dass Arten (hier in verschiedenen Farben dargestellt) sehr unterschiedliche Profile aufweisen, wenn man die Länge und Breite der Blütenblätter betrachtet, oder dass Iris setosa (blau) in Bezug auf ihre Blütenblattlänge homogener ist ( dh ihre Varianz ist geringer).
Sie können es sogar als Backend für Klassifizierungs- oder Dimensionsreduktionstechniken wie PCA verwenden. In den meisten Fällen möchten Sie bei der Durchführung einer PCA nicht nur den Funktionsbereich reduzieren, sondern auch Gruppen von Personen hervorheben (z. B. gibt es Personen, die bei einer Kombination der Variablen systematisch eine höhere Punktzahl erzielen). In der Regel führt dies dazu, dass die Faktorwerte hierarchisch gruppiert werden und die resultierende Clustermitgliedschaft im Fakultätsraum hervorgehoben wird (siehe FactoClass R-Paket).
Es wird auch in Clustergrammen ( Visualisierung nichthierarchischer und hierarchischer Clusteranalysen ) verwendet, die untersuchen sollen, wie sich die Clusterzuordnung bei Erhöhung der Clusteranzahl entwickelt (siehe auch Welche Stoppkriterien für agglomeratives hierarchisches Clustering werden in der Praxis verwendet? ).
Solche Anzeigen sind auch nützlich, wenn sie mit üblichen Streudiagrammen verknüpft sind (die konstruktionsbedingt auf 2D-Beziehungen beschränkt sind), dies als Bürsten bezeichnet werden und im Datenvisualisierungssystem GGobi oder in der Mondrian- Software verfügbar sind .