Ich lese dieses Buch ( NLTK ) und es ist verwirrend. Entropie ist definiert als : Die Entropie ist die Summe der Wahrscheinlichkeit jedes Etiketts mit der Protokollwahrscheinlichkeit desselben Etiketts Wie kann ich Entropie und maximale Entropie in Bezug auf Text Mining anwenden ? Kann mir jemand ein einfaches Beispiel …
Ich suche nach einer Möglichkeit, einen Text in n-Gramm aufzuteilen. Normalerweise würde ich so etwas machen wie: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Mir ist bewusst, dass nltk nur Bigramme und Trigramme anbietet. Gibt es jedoch …
Ich möchte in einem Python-Programm einchecken, ob ein Wort im englischen Wörterbuch enthalten ist. Ich glaube, dass die nltk wordnet-Schnittstelle der richtige Weg ist, aber ich habe keine Ahnung, wie ich sie für eine so einfache Aufgabe verwenden soll. def is_english_word(word): pass # how to I implement is_english_word? is_english_word(token.lower()) In …
Ich fange gerade an, NLTK zu verwenden, und ich verstehe nicht ganz, wie man eine Liste von Wörtern aus Text erhält. Wenn ich benutze nltk.word_tokenize(), bekomme ich eine Liste mit Wörtern und Satzzeichen. Ich brauche stattdessen nur die Worte. Wie kann ich Interpunktion loswerden? Funktioniert auch word_tokenizenicht mit mehreren Sätzen: …
Ich habe also einen Datensatz, dessen Verwendung ich Stoppwörter entfernen möchte stopwords.words('english') Ich habe Probleme damit, dies in meinem Code zu verwenden, um diese Wörter einfach herauszunehmen. Ich habe bereits eine Liste der Wörter aus diesem Datensatz. Der Teil, mit dem ich zu kämpfen habe, besteht darin, mit dieser Liste …
Im Shell-Skript überprüfe ich, ob diese Pakete installiert sind oder nicht. Wenn sie nicht installiert sind, installieren Sie sie. Also mit Shell-Skript: import nltk echo nltk.__version__ aber es stoppt das Shell-Skript in der importZeile im Linux-Terminal versucht, auf diese Weise zu sehen: which nltk das gibt nichts zu denken, dass …
Es fällt mir schwer, mit pip fast alles zu installieren. Ich bin neu in der Codierung, daher dachte ich, dass dies möglicherweise etwas ist, was ich falsch gemacht habe, und habe mich für easy_install entschieden, um das meiste, was ich tun musste, zu erledigen, was im Allgemeinen funktioniert hat. Jetzt …
Ich folgte einem Tutorial, das in Teil 1 und Teil 2 verfügbar war . Leider hatte der Autor nicht die Zeit für den letzten Abschnitt, in dem die Kosinusähnlichkeit verwendet wurde, um den Abstand zwischen zwei Dokumenten tatsächlich zu ermitteln. Ich habe die Beispiele im Artikel mit Hilfe des folgenden …
Ich rechnete damit, dass die Antwort auf meinen Titel oft darin besteht, die Dokumentationen zu lesen, aber ich habe das NLTK-Buch durchgesehen aber es gibt keine Antwort. Ich bin ein bisschen neu in Python. Ich habe eine Reihe von .txtDateien und möchte die Korpusfunktionen verwenden können, die NLTK für den …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.