Antworten:
Es kann sich lohnen, MW Berrys Bücher zu lesen:
Sie bestehen aus einer Reihe von Arbeitspapieren und Übersichtsarbeiten. Die neueste scheint als PDF unter folgender Adresse verfügbar zu sein: http://bit.ly/deNeiy .
Hier sind einige Links zu CA im Zusammenhang mit Text Mining:
Sie können sich auch die latente semantische Analyse ansehen , sehen dort aber meine Antwort: Ein Clustering-Problem durcharbeiten .
Suchen von Gruppen in Daten. Eine Einführung in die Clusteranalyse von den Professoren Leonard Kaufman und Peter J. Rousseeuw.
Ich lese das Buch und finde es sehr nützlich, weil:
Unser Ziel war es, ein anwendbares Buch für den allgemeinen Benutzer zu schreiben. Wir wollten die Clusteranalyse für Personen verfügbar machen, die nicht unbedingt einen starken mathematischen oder statistischen Hintergrund haben.
Es enthält theoretische Inhalte zum Verständnis der im R
Paket Cluster verfügbaren Funktionen .
Die Kapitel können nach der gewünschten Cluster-Methode einzeln gelesen werden.
Ausnahme ist Kapitel 3, das auf Kapitel 2 aufbaut
Die Kapitel des Buches sind:
Verweise:
Kaufman, L. & Rousseeuw, PJ (2005). Suchen von Gruppen in Daten. Eine Einführung in die Clusteranalyse (S. 342). John Wiley & Sons Inc.
Maechler, M. (2013). Clusteranalyse Erweitert Rousseeuw et al. CRAN.
Dieses Kapitel der Einführung in Data Mining ist online verfügbar und bietet einen schönen Überblick.
Nicht speziell über Text-Mining, aber ich mochte "Exploratory Data Analysis with MATLAB" von Martinez und Martinez.
Ein weiteres ausführliches Buch, das einen Blick wert ist: das Handbuch zur Clusteranalyse von Hennig et al. (2015)