Daten aus der realen Welt haben manchmal eine natürliche Anzahl von Clustern (der Versuch, sie in eine Anzahl von Clustern zu gruppieren, die kleiner als ein magisches k ist, führt zu einem dramatischen Anstieg der Clusterkosten). Heute habe ich einen Vortrag von Dr. Adam Meyerson besucht und er hat diese Art von Daten als "trennbare Daten" bezeichnet.
Was sind andere Cluster-Formalisierungen als K-Mittel, die für Cluster-Algorithmen (Approximationen oder Heuristiken) geeignet sein könnten, die die natürliche Trennbarkeit von Daten ausnutzen würden?