Eines der größten Probleme bei der Clusteranalyse ist, dass wir möglicherweise unterschiedliche Schlussfolgerungen ziehen müssen, wenn wir auf unterschiedlichen verwendeten Clustering-Methoden (einschließlich unterschiedlicher Verknüpfungsmethoden bei hierarchischem Clustering) basieren.
Ich möchte Ihre Meinung dazu wissen - welche Methode Sie wählen, und wie. Man könnte sagen "Die beste Methode zum Clustering ist die richtige Antwort"; Ich kann jedoch die Frage stellen, ob die Clusteranalyse eine unbeaufsichtigte Technik sein soll. Woher weiß ich, welche Methode oder Verknüpfung die richtige Antwort ist?
Generell gilt: Ist ein Clustering allein robust genug, um sich darauf zu verlassen? Oder brauchen wir eine zweite Methode, um ein gemeinsames Ergebnis zu erzielen, das auf beiden basiert?
Meine Frage bezieht sich nicht nur auf mögliche Methoden zur Validierung / Bewertung der Clusterleistung, sondern ist auch umfassender: Auf welcher Grundlage wählen / bevorzugen wir eine Clustermethode / einen Clusteralgorithmus gegenüber einer anderen. Gibt es außerdem allgemeine Warnungen , nach denen wir suchen sollten, wenn wir eine Methode zum Clustering unserer Daten auswählen?
Ich weiß, dass es eine sehr allgemeine Frage ist und sehr schwer zu beantworten ist. Ich würde nur gerne wissen, ob Sie Kommentare, Ratschläge oder Vorschläge haben, um mehr darüber zu erfahren.