Es gibt eine Vielzahl von Clustering-Methoden, die von Natur aus explorativ sind, und ich glaube nicht, dass eine von ihnen, ob hierarchisch oder partitioniert, auf der Art von Annahmen beruht, die man zur Analyse der Varianz treffen muss.
Als ich mir die [MV] -Dokumentation in Stata ansah, um Ihre Frage zu beantworten, fand ich dieses amüsante Zitat auf Seite 85:
Obwohl einige gesagt haben, dass es so viele Methoden zur Clusteranalyse gibt, wie es Leute gibt, die eine Clusteranalyse durchführen. Das ist eine grobe Untertreibung! Es gibt unendlich mehr Möglichkeiten, eine Clusteranalyse durchzuführen, als Menschen, die sie durchführen.
In diesem Zusammenhang bezweifle ich, dass es Annahmen gibt, die für alle Clustering-Methoden gelten. Der Rest des Textes legt lediglich als allgemeine Regel fest, dass Sie eine Art "Unähnlichkeitsmaß" benötigen, bei dem es sich nicht einmal um einen metrischen Abstand handeln muss, um Cluster zu erstellen.
Es gibt jedoch eine Ausnahme: Wenn Sie Beobachtungen im Rahmen einer Analyse nach der Schätzung in Gruppen zusammenfassen. In Stata enthält der vce
Befehl auf Seite 86 derselben Quelle die folgende Warnung:
Wenn Sie mit den zahlreichen Schätzungsbefehlen von Stata vertraut sind, müssen Sie sorgfältig zwischen der Cluster-Analyse (dem Cluster-Befehl) und der Option vce (Cluster-Clustvar) unterscheiden, die bei vielen Schätzungsbefehlen zulässig ist. Die Clusteranalyse findet Gruppen in Daten. Die Option vce (cluster clustvar), die mit verschiedenen Schätzungsbefehlen zulässig ist, gibt an, dass die Beobachtungen über die von der Option definierten Gruppen hinweg unabhängig sind, jedoch nicht unbedingt innerhalb dieser Gruppen. Eine vom Befehl cluster erzeugte Gruppierungsvariable erfüllt selten die Annahme, dass die Option vce (cluster clustvar) verwendet wird.
Auf dieser Grundlage würde ich davon ausgehen, dass unabhängige Beobachtungen außerhalb dieses speziellen Falls nicht erforderlich sind. Intuitiv möchte ich hinzufügen, dass die Clusteranalyse möglicherweise sogar genau dazu verwendet wird, um zu untersuchen, inwieweit die Beobachtungen unabhängig sind oder nicht.
Abschließend möchte ich erwähnen, dass Lawrence Hamilton auf Seite 356 von Statistics with Stata standardisierte Variablen als einen "wesentlichen" Aspekt der Clusteranalyse erwähnt, obwohl er auf dieses Thema nicht näher eingeht.