Nehmen wir also an, ich habe eine Reihe von Datenpunkten in R ^ n, wobei n ziemlich groß ist (wie 50). Ich weiß, dass diese Daten in drei Cluster unterteilt sind und ich weiß, zu welchem Cluster jeder Datenpunkt gehört. Alles, was ich tun möchte, ist, diese Cluster in 2D so zu visualisieren, dass die visuelle Trennung zwischen Clustern, die ich sehe, maximiert wird, mit dem Ziel zu beweisen, dass die Cluster basierend auf der Position des Datenpunkts in R leicht trennbar sind ^ n allein.
Die Art und Weise, wie ich dies bisher gemacht habe, besteht darin, eine PCA-Transformation für die Datenpunkte durchzuführen und dann zufällig PC-Paare zu visualisieren, bis ich einen finde, bei dem die Cluster ziemlich sauber getrennt zu sein scheinen. Dieser Ansatz scheint jedoch ziemlich ad hoc zu sein, und es scheint eine einfache Möglichkeit zu geben, eine Rotation der Daten im PCA-Stil zu finden, die anstelle der Maximierung der Gesamtvarianz die Trennung zwischen den Clustern maximiert.
Gibt es eine Standardtechnik, die dies tut? Wenn nicht, irgendwelche Ideen, wie man eine solche Transformation schafft?