Als «nltk» getaggte Fragen

Das Natural Language Toolkit ist eine Python-Bibliothek für Computerlinguistik.

7
Was ist "Entropie und Informationsgewinn"?
Ich lese dieses Buch ( NLTK ) und es ist verwirrend. Entropie ist definiert als : Die Entropie ist die Summe der Wahrscheinlichkeit jedes Etiketts mit der Protokollwahrscheinlichkeit desselben Etiketts Wie kann ich Entropie und maximale Entropie in Bezug auf Text Mining anwenden ? Kann mir jemand ein einfaches Beispiel …

15
Fehler beim Laden von english.pickle mit nltk.data.load
Beim Versuch, den punktTokenizer zu laden ... import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ... a LookupErrorwurde angehoben: > LookupError: > ********************************************************************* > Resource 'tokenizers/punkt/english.pickle' not found. Please use the NLTK Downloader to obtain the resource: nltk.download(). Searched in: > - 'C:\\Users\\Martinos/nltk_data' > - 'C:\\nltk_data' > - 'D:\\nltk_data' > - 'E:\\nltk_data' > …
144 python  jenkins  nltk 


15
n-Gramm in Python, vier, fünf, sechs Gramm?
Ich suche nach einer Möglichkeit, einen Text in n-Gramm aufzuteilen. Normalerweise würde ich so etwas machen wie: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Mir ist bewusst, dass nltk nur Bigramme und Trigramme anbietet. Gibt es jedoch …
136 python  string  nltk  n-gram 

9
Wie kann ich mit Python überprüfen, ob ein Wort ein englisches Wort ist?
Ich möchte in einem Python-Programm einchecken, ob ein Wort im englischen Wörterbuch enthalten ist. Ich glaube, dass die nltk wordnet-Schnittstelle der richtige Weg ist, aber ich habe keine Ahnung, wie ich sie für eine so einfache Aufgabe verwenden soll. def is_english_word(word): pass # how to I implement is_english_word? is_english_word(token.lower()) In …
134 python  nltk  wordnet 


11
Wie entferne ich die Interpunktion mit dem NLTK-Tokenizer?
Ich fange gerade an, NLTK zu verwenden, und ich verstehe nicht ganz, wie man eine Liste von Wörtern aus Text erhält. Wenn ich benutze nltk.word_tokenize(), bekomme ich eine Liste mit Wörtern und Satzzeichen. Ich brauche stattdessen nur die Worte. Wie kann ich Interpunktion loswerden? Funktioniert auch word_tokenizenicht mit mehreren Sätzen: …
125 python  nlp  tokenize  nltk 

12
So entfernen Sie Stoppwörter mit nltk oder Python
Ich habe also einen Datensatz, dessen Verwendung ich Stoppwörter entfernen möchte stopwords.words('english') Ich habe Probleme damit, dies in meinem Code zu verwenden, um diese Wörter einfach herauszunehmen. Ich habe bereits eine Liste der Wörter aus diesem Datensatz. Der Teil, mit dem ich zu kämpfen habe, besteht darin, mit dieser Liste …
109 python  nltk  stop-words 


25
Pip Problem Installation fast jeder Bibliothek
Es fällt mir schwer, mit pip fast alles zu installieren. Ich bin neu in der Codierung, daher dachte ich, dass dies möglicherweise etwas ist, was ich falsch gemacht habe, und habe mich für easy_install entschieden, um das meiste, was ich tun musste, zu erledigen, was im Allgemeinen funktioniert hat. Jetzt …
100 python  pip  nltk  easy-install 

17
Ressource u'tokenizers / punkt / english.pickle 'nicht gefunden
Mein Code: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') Fehlermeldung: [ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", line 16, in <module> tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load opened_resource = _open(resource_url) File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open return find(path_, path + ['']).open() File "/usr/lib/python2.6/site-packages/nltk/data.py", line 618, …
96 python  unix  nltk 




3
Erstellen eines neuen Korpus mit NLTK
Ich rechnete damit, dass die Antwort auf meinen Titel oft darin besteht, die Dokumentationen zu lesen, aber ich habe das NLTK-Buch durchgesehen aber es gibt keine Antwort. Ich bin ein bisschen neu in Python. Ich habe eine Reihe von .txtDateien und möchte die Korpusfunktionen verwenden können, die NLTK für den …
83 python  nlp  nltk  corpus 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.