Unter welchen Bedingungen ist K-bedeutet Clustering transformationsinvariant?

Bei einer Menge von Datenpunkten $X = \{x_1, x_2, \ldots, x_m\}$ wobei $x_i \in \mathbb{R}^d$ wir K-Mittel auf $X$ und erhalten die Cluster $c_1, c_2, \ldots, c_k$ .

Wenn wir nun einen neuen Datensatz wobei und und K-means auf ausführen , um die Cluster . $Y = \{y_1, y_2, \ldots, y_m\}$ $y_i = Ax_i + b$ $y_i \in \mathbb{R}^d$ $Y$ $g_1, g_2, \ldots g_k$

Unter welchen Bedingungen von und erhalten wir garantiert die gleichen Cluster? $A$ $b$

Nehmen wir an, dass K-means den euklidischen Abstand verwendet und für beide Algorithmen die gleichen Anfangsbedingungen hat wenn die Anfangszentren für X dann sind die Anfangszentren für Y wobei . $c^0_1, \ldots, c^0_k$ $g^0_1, \ldots, g^0_k$ $g^0_i = Ac^0_i + b$

Bisher habe ich gedacht, dass den vollen Rang haben muss und ein beliebiger Vektor sein kann. Ich konnte es jedoch nicht beweisen. $A$ $b$

algorithms clustering

— Ana Echavarria
quelle

Die Antwort hängt von Ihrem K-Means-Algorithmus ab, aber was folgt, sollte für Standardalgorithmen funktionieren.

Sie erhalten das gleiche Ergebnis, wenn Ihre Transformation zwei Bedingungen erfüllt: $T$

Es werden Abstände beibehalten: , wobei Ihre Metrik ist, sagen wir. $d(z,w) = d(T(z),T(w))$ $d$ $d(z,w) = \|z-w\|$
Es werden Durchschnittswerte beibehalten: Wenn eine konvexe Kombination ist, ist . $\sum_i p_i z_i$ $T(\sum_i p_i z_i) = \sum_i p_i T(z_i)$

Sie können dies überprüfen, indem Sie den Algorithmus durchgehen und zeigen, dass er immer die gleichen Entscheidungen trifft.

— Yuval Filmus
quelle

Danke Yuval, das macht sehr viel Sinn. Würde dies dann bedeuten, dass A für den euklidischen Abstand eine orthogonale Matrix sein müsste, um eine starre Transformation zu erzeugen?

— Ana Echavarria

Es scheint so.

— Yuval Filmus