Bei einer Menge von Datenpunkten wobei wir K-Mittel auf und erhalten die Cluster .
Wenn wir nun einen neuen Datensatz wobei und und K-means auf ausführen , um die Cluster .y i = A x i + b y i ∈ R d Y g 1 , g 2 , … g k
Unter welchen Bedingungen von und erhalten wir garantiert die gleichen Cluster?b
Nehmen wir an, dass K-means den euklidischen Abstand verwendet und für beide Algorithmen die gleichen Anfangsbedingungen hat wenn die Anfangszentren für X dann sind die Anfangszentren für Y wobei g ^ 0_i = Ac ^ 0_i + b . g 0 1 , … , g 0 k g 0 i = A c 0 i + b
Bisher habe ich gedacht, dass den vollen Rang haben muss und b ein beliebiger Vektor sein kann. Ich konnte es jedoch nicht beweisen.b