Als «clustering» getaggte Fragen

Die Clusteranalyse ist die Aufgabe, Daten gemäß ihrer gegenseitigen "Ähnlichkeit" in Teilmengen von Objekten zu partitionieren, ohne bereits vorhandenes Wissen wie Klassenbezeichnungen zu verwenden. [Clustered-Standard-Fehler und / oder Cluster-Beispiele sollten als solche gekennzeichnet werden. Verwenden Sie NICHT das "Clustering" -Tag für sie.]


4
Irgendwelche Vorschläge für eine Clustering-Methode für eine unbekannte Anzahl von Clustern und eine nichteuklidische Entfernung?
Ich benötige einen Vorschlag für die Clustering-Methode (unbeaufsichtigte Klassifizierung) für ein Beratungsprojekt. Ich suche eine Methode, die hoffentlich die folgenden Eigenschaften hat: Das Thema meiner Studie hat drei Eigenschaften. Eine wird durch eine (nichteuklidische) Distanzmatrix dargestellt und die anderen beiden liegen in Form von Vektoren im euklidischen Raum vor. Die …




1
Clustering von Zeitreihen
Ich habe viele Zeitreihen in diesem Format 1 Spalte, in der ich Datumsformat (d / m / Jahr) habe, und viele Spalten, die verschiedene Zeitreihen darstellen, wie hier: DATE TS1 TS2 TS3 ... 24/03/2003 0.00 0.00 ... 17/04/2003 -0.05 1.46 11/05/2003 0.46 -3.86 04/06/2003 -2.21 -1.08 28/06/2003 -1.18 -2.16 22/07/2003 …


1
Kann jemand den C-Index im Kontext des hierarchischen Clusters erklären?
Dies ist eine Fortsetzung dieser Frage. Ich versuche derzeit, den C-Index zu implementieren, um eine nahezu optimale Anzahl von Clustern aus einer Hierarchie von Clustern zu finden. Dazu berechne ich den C-Index für jeden Schritt der (agglomerativen) hierarchischen Clusterbildung. Das Problem ist, dass der C-Index für sehr degenerierte Cluster minimal …

2
Auswählen der Anzahl der Cluster - Kriterien für die Clustervalidierung im Vergleich zu domänentheoretischen Überlegungen
Ich stehe oft vor dem Problem, eine bestimmte Anzahl von Clustern auswählen zu müssen. Die Partition, die ich am Ende wähle, basiert häufiger auf visuellen und theoretischen Bedenken als auf Qualitätskriterien. Ich habe zwei Hauptfragen. Der erste betrifft die allgemeine Idee der Clusterqualität. Soweit ich weiß, schlagen Kriterien wie der …

2
Multivariates Zeitreihen-Clustering
Ich sammle eine Gruppe multivariater Zeitsequenzen. Zum Beispiel gibt es 2000 Zeitreihen. Jede Zeitreihe hat 12 Dimensionen. Gibt es systematische Modelle / Algorithmen, die multivariate Zeitreihen gruppieren können? Zum Beispiel möchte ich einige Zeitreihen identifizieren, die sich stark von anderen unterscheiden. Darüber hinaus kann ich für die Online-Überwachung diesen Algorithmus …


2
k-means ++ Algorithmus und Ausreißer
Es ist bekannt, dass der k-means-Algorithmus bei Ausreißern leidet. k-means ++ ist eine effektive Methode zur Initalisierung von Clusterzentren. Ich habe die PPT von den Gründern der Methode, Sergei Vassilvitskii und David Arthur http://theory.stanford.edu/~sergei/slides/BATS-Means.pdf (Folie 28) , durchlaufen, was zeigt, dass die Cluster-Center-Initialisierung ist nicht vom Ausreißer betroffen, wie unten …

1
Clustering und A / B-Tests
Meine Frage lautet wie folgt: Stellen wir uns vor, ich habe Cluster in meinen Daten definiert (verschiedene Kundensegmente) und führe einen A / B-Test durch. Kann ich die Leistungen der verschiedenen Cluster beim A / B-Test vergleichen? Ich habe nicht viel Literatur darauf gefunden (tatsächlich fast keine), also habe ich …

2
Alternative Entfernungsmetriken für zwei Zeitreihen
Ich habe Zeitreihendaten von verschiedenen Häusern. Angenommen, es handelt sich um Stromverbrauchsdaten. Jetzt möchte ich die Häuser nach einem ähnlichen Stromverbrauchsmuster gruppieren. Zu den verschiedenen Entfernungsmetriken, die ich mir vorstellen kann, um die Ähnlichkeit zu messen, gehören: Euklidische Entfernung DTW- Entfernung Frechet Entfernung Mit euklidischer Distanz fand ich einen Ausreißer …

2
Wie werden Diagramme von k-nächsten Nachbarn erstellt? (zum Clustering)
Ich habe gesehen, dass es mehrere Clustering-Algorithmen gibt (zum Beispiel CHAMELEON oder sogar Spectral Clustering), die die Daten in einen gewichteten (oder manchmal ungewichteten) k-Nächsten-Nachbarn-Graphen konvertieren, basierend auf den Abständen zwischen Punkten / Beobachtungen / Zeilen und Ich habe mich gefragt, wie diese Grafiken generiert werden. Sind diese Grafiken gerichtet? …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.