Bei Clustering-Methoden wie K-means ist der euklidische Abstand die zu verwendende Metrik. Daher berechnen wir nur die Mittelwerte innerhalb jedes Clusters. Anschließend werden die Elemente anhand ihres Abstands zu jedem Mittelwert angepasst.
Ich habe mich gefragt, warum die Gaußsche Funktion nicht als Metrik verwendet wird. Anstatt zu verwenden xi -mean(X)
, können wir verwenden exp(- (xi - mean(X)).^2/std(X).^2)
. Somit wird nicht nur die Ähnlichkeit zwischen den Clustern gemessen (Mittelwert), sondern auch die Ähnlichkeit innerhalb des Clusters berücksichtigt (Standard). Entspricht dies auch dem Gaußschen Mischungsmodell ?
Es ist hier jenseits meiner Frage, aber ich denke , dass eine Mittelwertverschiebung dieselbe Frage wie oben aufwerfen kann.