Ich habe kürzlich vier Bücher in diesem Bereich gelesen:
Feldman, R. und James Sanger, J. (2006). Das Text Mining-Handbuch: Erweiterte Ansätze zur Analyse unstrukturierter Daten. Cambridge University Press.
Dieser konzentriert sich auf praktische Beispiele, Software und angewandtes Text Mining. Es enthält mehrere Beispiele für die praktische Verwendung von Text-Mining. Es könnte von Interesse sein, wenn Sie mehr über kommerzielle Anwendungen von Text-Mining-Tools erfahren möchten.
Srivastava, AN und Sahami, M. (2009). Text Mining: Klassifizierung, Clustering und Anwendungen. Chapman & Hall / CRC.
Es handelt sich um eine Reihe von Forschungsarbeiten, die als Beispiele für die Verwendung verschiedener Text-Mining-Tools verwendet werden. Es ist eher zu fokussiert als für den Einführungstest.
Weiss, SM, Indurkhya, N., Zhang, T. und Damerau, F. (2005). Text Mining: Vorhersagemethoden zur Analyse unstrukturierter Informationen.
Springer.
Sehr einführender Text, der einige allgemeine Probleme beschreibt.
Manning, C. (1999). Grundlagen der statistischen Verarbeitung natürlicher Sprache. MIT Press.
Dies ist das beste Buch, das ich bereits zu diesem Thema gelesen habe. Es ist gut geschrieben, klar, geht tiefer in die Theorie ein, aber auf praxisfreundliche Weise. Beginnt mit einer allgemeinen Einführung, geht dann aber auf einige der am häufigsten verwendeten Methoden und Algorithmen ein. Wenn Sie nur ein einziges Buch auswählen müssten, würde ich dieses empfehlen.
Sie können auch leicht mehrere Bücher über die Verarbeitung natürlicher Sprache und Text Mining finden, die sich auf die Verwendung von R ( tm library) oder Python ( nltk library) konzentrieren.