Antworten:
Es ist im Grunde ein Maß für die Güte der Klassifikation, die k-means gefunden hat. SS steht offensichtlich für Summe der Quadrate, es ist also die übliche Zerlegung von Abweichungen in Abweichungen zwischen und Abweichungen innerhalb. Idealerweise möchten Sie ein Clustering mit den Eigenschaften interner Kohäsion und externer Trennung, dh das BSS / TSS-Verhältnis sollte sich 1 nähern.
Zum Beispiel in R:
data(iris)
km <- kmeans(iris[,1:4], 3)
ergibt ein BSS / TSS-Verhältnis von 88,4% (0,884), was eine gute Anpassung anzeigt. Sie sollten vorsichtig sein, und es ist normalerweise eine gute Idee, das WSS gegen die Anzahl der Cluster zu zeichnen, da diese Anzahl im Voraus angegeben werden muss.