Aus konzeptioneller und algorithmischer Sicht verstehe ich, wie K-means funktioniert. Aus mathematischer Sicht verstehe ich jedoch nicht, warum das Minimieren des WCSS (Quadratsummen innerhalb des Clusters) notwendigerweise den Abstand zwischen Clustern maximiert . Mit anderen Worten, kann jemand zeigen, wie diese Funktion der Maximierung des Abstands zwischen Clustern entspricht? Es wäre hilfreich, eine Ableitung zu sehen, die alle Schritte zeigt, oder mich auf die entsprechenden Referenzen zu verweisen.
Update Ich habe diese Referenz von Witten und Tibshirani gefunden, aber es ist nicht offensichtlich, wie ich von Gleichung 7 zu Gleichung 8 komme.