Ich habe eine sehr grundlegende Frage zum Clustering. Wie interpretiere ich die Klassen der Datenpunkte, die ich geclustert habe (nachdem ich jedem Cluster aussagekräftige Klassenbezeichnungen zugewiesen habe), nachdem ich k Cluster mit ihren Schwerpunkten gefunden habe? Ich spreche nicht von der Validierung der gefundenen Cluster.
Kann dies bei einem kleinen beschrifteten Satz von Datenpunkten durchgeführt werden? Berechnen Sie, zu welchem Cluster diese beschrifteten Punkte gehören, und entscheiden Sie anhand des Typs und der Anzahl der Punkte, die jeder Cluster erhält, über die Beschriftung. Dies scheint ziemlich offensichtlich zu sein, aber ich weiß nicht, wie Standard es ist, Clustern auf diese Weise Labels zuzuweisen.
Um es klar auszudrücken, möchte ich unbeaufsichtigtes Clustering durchführen, bei dem keine Labels verwendet werden, um zuerst meine Cluster zu finden. Nachdem ich die Cluster gefunden habe, möchte ich den Clustern anhand der Eigenschaften einiger Beispieldatenpunkte aussagekräftige Klassenbezeichnungen zuweisen.