Eine Möglichkeit, einer Variablen ein Gewicht zuzuweisen, besteht darin, ihre Skala zu ändern. Der Trick funktioniert für die von Ihnen erwähnten Clustering-Algorithmen, nämlich. k-Mittel, gewichtete durchschnittliche Verknüpfung und durchschnittliche Verknüpfung.
Kaufman, Leonard und Peter J. Rousseeuw. " Gruppen in Daten finden: Eine Einführung in die Clusteranalyse ." (2005) - Seite 11:
Die Wahl der Maßeinheiten führt zu relativen Gewichten der Variablen. Das Ausdrücken einer Variablen in kleineren Einheiten führt zu einem größeren Bereich für diese Variable, was sich stark auf die resultierende Struktur auswirkt. Andererseits versucht man durch Standardisierung, allen Variablen das gleiche Gewicht zu geben, in der Hoffnung, Objektivität zu erreichen. Als solches kann es von einem Praktiker verwendet werden, der keine Vorkenntnisse besitzt. Es kann jedoch durchaus sein, dass einige Variablen in einer bestimmten Anwendung an sich wichtiger sind als andere, und dann sollte die Zuweisung von Gewichten auf dem Fachwissen basieren (siehe z. B. Abrahamowicz, 1985).
Andererseits gab es Versuche, Clustering-Techniken zu entwickeln, die unabhängig von der Skalierung der Variablen sind (Friedman und Rubin, 1967). Der Vorschlag von Hardy und Rasson (1982) besteht darin, nach einer Partition zu suchen, die das Gesamtvolumen der konvexen Hüllen der Cluster minimiert. Im Prinzip ist ein solches Verfahren in Bezug auf lineare Transformationen der Daten unveränderlich, aber leider existiert kein Algorithmus für seine Implementierung (mit Ausnahme einer Näherung, die auf zwei Dimensionen beschränkt ist). Daher scheint das Dilemma der Standardisierung derzeit unvermeidlich, und die in diesem Buch beschriebenen Programme überlassen die Wahl dem Benutzer
Abrahamowicz, M. (1985), Die Verwendung nicht numerischer a pnon-Informationen zur Messung von Unähnlichkeiten, Vortrag, der auf der vierten europäischen Tagung der Psychometrischen Gesellschaft und der Klassifikationsgesellschaften vom 2. bis 5. Juli in Cambridge (Großbritannien) vorgestellt wurde.
Friedman, HP und Rubin, J. (1967), zu einigen invarianten Kriterien für die Gruppierung von Daten. J. Amer. Statist. ASSOC6., 2, 1159 & ndash; 1178.
Hardy, A. und Rasson, JP (1982), Une nouvelle Approche des Problemes de Classification Automatique, Statist. Anal. Donnies, 7, 41 & ndash; 56.