Empfohlene Bücher oder Artikel als Einführung in die Clusteranalyse?


12

Ich arbeite an einem kleinen Textkorpus (200 Millionen), den ich mit einer Clusteranalyse untersuchen möchte. Welche Bücher oder Artikel zu diesem Thema würden Sie empfehlen?

Antworten:


6

Es kann sich lohnen, MW Berrys Bücher zu lesen:

  1. Übersicht über Text Mining I: Clustering, Klassifizierung und Abfrage (2003)
  2. Übersicht über Text Mining II: Clustering, Klassifizierung und Abfrage (2008)

Sie bestehen aus einer Reihe von Arbeitspapieren und Übersichtsarbeiten. Die neueste scheint als PDF unter folgender Adresse verfügbar zu sein: http://bit.ly/deNeiy .

Hier sind einige Links zu CA im Zusammenhang mit Text Mining:

Sie können sich auch die latente semantische Analyse ansehen , sehen dort aber meine Antwort: Ein Clustering-Problem durcharbeiten .


5

Suchen von Gruppen in Daten. Eine Einführung in die Clusteranalyse von den Professoren Leonard Kaufman und Peter J. Rousseeuw.

Ich lese das Buch und finde es sehr nützlich, weil:

  • Wie von den Autoren im Vorwort angegeben:

Unser Ziel war es, ein anwendbares Buch für den allgemeinen Benutzer zu schreiben. Wir wollten die Clusteranalyse für Personen verfügbar machen, die nicht unbedingt einen starken mathematischen oder statistischen Hintergrund haben.

  • Es enthält theoretische Inhalte zum Verständnis der im RPaket Cluster verfügbaren Funktionen .

  • Die Kapitel können nach der gewünschten Cluster-Methode einzeln gelesen werden.
    Ausnahme ist Kapitel 3, das auf Kapitel 2 aufbaut

Die Kapitel des Buches sind:

  1. Einführung
  2. Partitionierung um Medoids (Programm PAM).
  3. Clustering großer Anwendungen (Programm CLARA).
  4. Fuzzy-Analyse (Programm FUNNY).
  5. Agglomeratives Nesting (Programm AGNES).
  6. Divisive Analyse (Programm DIANA).
  7. Monothetische Analyse (Programm MONA).

Verweise:

Kaufman, L. & Rousseeuw, PJ (2005). Suchen von Gruppen in Daten. Eine Einführung in die Clusteranalyse (S. 342). John Wiley & Sons Inc.

Maechler, M. (2013). Clusteranalyse Erweitert Rousseeuw et al. CRAN.


Dieses Buch bietet in der Tat einen schönen Überblick über das Gebiet. Es konzentriert sich auf einige Algorithmen / Methoden (z. B. die bekannte Silhouette, die zufällig von einem der Autoren des Buches entworfen wurde) und behandelt sie ausführlich. Es kommt auch mit einigem Code, aber im Stil von 1990. Zu Ihrer Information: vollständiges Inhaltsverzeichnis .
Franck Dernoncourt


2

Die Clusteranalyse von Brian S. Everitt ist eine schöne, buchlange angewandte Behandlung der Clusteranalyse.



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.