Die Meldung nach der ANOVA-Tabelle nach der K-Mittelwert-Analyse zeigt, dass Signifikanzniveaus nicht als Test gleicher Mittelwerte betrachtet werden sollten, da die Cluster-Lösung basierend auf dem euklidischen Abstand abgeleitet wurde, um den Abstand zu maximieren. Welchen Test sollte ich verwenden, um zu zeigen, ob sich die Mittelwerte der Clustervariablen zwischen den Clustern unterscheiden? Ich habe diese Warnung in der von k-means ausgegebenen ANOVA-Tabelle gesehen, aber in einigen Referenzen sehe ich, dass Post-Hoc-ANOVA-Tests ausgeführt werden. Sollte ich k-mean ANOVA-Ausgaben ignorieren und eine Einweg-ANOVA mit Post-hoc-Tests ausführen und sie auf herkömmliche Weise interpretieren? Oder kann ich nur einen Hinweis auf die Größe des F-Werts geben und welche Variablen haben mehr zum Unterschied beigetragen? Eine weitere Verwirrung ist, dass Cluster-Variablen nicht normal verteilt sind, was gegen die Annahme von ANOVA verstößt. dann könnte ich Kruskal-Wallis nicht-parametrischen Test verwenden, aber es hat die Annahme über die gleichen Verteilungen. Die Inter-Cluster-Verteilungen für die spezifischen Variablen scheinen nicht gleich zu sein, einige sind positiv verzerrt, andere negativ ... Ich habe 1275 große Stichproben, 5 Cluster, 10 Cluster-Variablen, gemessen in PCA-Scores.