Empfohlene Bücher oder Artikel als Einführung in die Clusteranalyse?

12

Ich arbeite an einem kleinen Textkorpus (200 Millionen), den ich mit einer Clusteranalyse untersuchen möchte. Welche Bücher oder Artikel zu diesem Thema würden Sie empfehlen?

machine-learning references clustering

— Miku
quelle

6

Es kann sich lohnen, MW Berrys Bücher zu lesen:

Übersicht über Text Mining I: Clustering, Klassifizierung und Abfrage (2003)
Übersicht über Text Mining II: Clustering, Klassifizierung und Abfrage (2008)

Sie bestehen aus einer Reihe von Arbeitspapieren und Übersichtsarbeiten. Die neueste scheint als PDF unter folgender Adresse verfügbar zu sein: http://bit.ly/deNeiy .

Hier sind einige Links zu CA im Zusammenhang mit Text Mining:

Sie können sich auch die latente semantische Analyse ansehen , sehen dort aber meine Antwort: Ein Clustering-Problem durcharbeiten .

— U / min chl
quelle

5

Suchen von Gruppen in Daten. Eine Einführung in die Clusteranalyse von den Professoren Leonard Kaufman und Peter J. Rousseeuw.

Ich lese das Buch und finde es sehr nützlich, weil:

Wie von den Autoren im Vorwort angegeben:

Unser Ziel war es, ein anwendbares Buch für den allgemeinen Benutzer zu schreiben. Wir wollten die Clusteranalyse für Personen verfügbar machen, die nicht unbedingt einen starken mathematischen oder statistischen Hintergrund haben.

Es enthält theoretische Inhalte zum Verständnis der im RPaket Cluster verfügbaren Funktionen .
Die Kapitel können nach der gewünschten Cluster-Methode einzeln gelesen werden.
_{Ausnahme ist Kapitel 3, das auf Kapitel 2 aufbaut}

Die Kapitel des Buches sind:

Einführung
Partitionierung um Medoids (Programm PAM).
Clustering großer Anwendungen (Programm CLARA).
Fuzzy-Analyse (Programm FUNNY).
Agglomeratives Nesting (Programm AGNES).
Divisive Analyse (Programm DIANA).
Monothetische Analyse (Programm MONA).

Verweise:

Kaufman, L. & Rousseeuw, PJ (2005). Suchen von Gruppen in Daten. Eine Einführung in die Clusteranalyse (S. 342). John Wiley & Sons Inc.

Maechler, M. (2013). Clusteranalyse Erweitert Rousseeuw et al. CRAN.

— Andre Silva
quelle

Dieses Buch bietet in der Tat einen schönen Überblick über das Gebiet. Es konzentriert sich auf einige Algorithmen / Methoden (z. B. die bekannte Silhouette, die zufällig von einem der Autoren des Buches entworfen wurde) und behandelt sie ausführlich. Es kommt auch mit einigem Code, aber im Stil von 1990. Zu Ihrer Information: vollständiges Inhaltsverzeichnis .

— Franck Dernoncourt

4

Dieses Kapitel der Einführung in Data Mining ist online verfügbar und bietet einen schönen Überblick.

— Shane
quelle

Und hier ist der Link zur 2. Auflage (2018).

— Richard Hardy

2

Die Clusteranalyse von Brian S. Everitt ist eine schöne, buchlange angewandte Behandlung der Clusteranalyse.

— Brett
quelle

1

Nicht speziell über Text-Mining, aber ich mochte "Exploratory Data Analysis with MATLAB" von Martinez und Martinez.

— nico
quelle

1

Ein weiteres ausführliches Buch, das einen Blick wert ist: das Handbuch zur Clusteranalyse von Hennig et al. (2015)

— tbeck
quelle