Als «nlp» getaggte Fragen

Die Verarbeitung natürlicher Sprache (NLP) ist ein Teilbereich der künstlichen Intelligenz, in dem nützliche Informationen aus Daten natürlicher Sprache transformiert oder extrahiert werden. Zu den Methoden gehören maschinelles Lernen und regelbasierte Ansätze.



10
Java Stanford NLP: Teil von Sprachbezeichnungen?
Die Stanford NLP, demo'd hier , gibt einen Ausgang wie folgt aus : Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. Was bedeuten die Part of Speech-Tags? Ich kann keine offizielle Liste finden. Ist es Stanfords eigenes System oder verwenden sie universelle Tags? (Was ist JJzum Beispiel?) Wenn ich zum Beispiel die …

15
Silben in einem Wort erkennen
Ich muss einen ziemlich effizienten Weg finden, um Silben in einem Wort zu erkennen. Z.B, Unsichtbar -> in-vi-sib-le Es gibt einige Silbenregeln, die verwendet werden könnten: V CV VC CVC CCV CCCV CVCC * wobei V ein Vokal und C ein Konsonant ist. Z.B, Aussprache (5 Pro-nun-ci-a-tion; CV-CVC-CV-V-CVC) Ich habe …



11
Wie entferne ich die Interpunktion mit dem NLTK-Tokenizer?
Ich fange gerade an, NLTK zu verwenden, und ich verstehe nicht ganz, wie man eine Liste von Wörtern aus Text erhält. Wenn ich benutze nltk.word_tokenize(), bekomme ich eine Liste mit Wörtern und Satzzeichen. Ich brauche stattdessen nur die Worte. Wie kann ich Interpunktion loswerden? Funktioniert auch word_tokenizenicht mit mehreren Sätzen: …
125 python  nlp  tokenize  nltk 


2
Java oder Python für die Verarbeitung natürlicher Sprache [geschlossen]
Geschlossen . Diese Frage basiert auf Meinungen . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage, damit sie mit Fakten und Zitaten beantwortet werden kann, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 6 Jahren . Verbessere diese Frage Ich würde gerne wissen, welche …
112 java  python  nlp 

21
Wie mache ich Wortstemming oder Lemmatisierung?
Ich habe PorterStemmer und Snowball ausprobiert, aber beide funktionieren nicht bei allen Wörtern, da einige sehr häufig fehlen. Meine Testwörter sind: " Katzen, die Kakteen-Kakteen-Kakteen-Communitys laufen lassen ", und beide bekommen weniger als die Hälfte richtig. Siehe auch: Stemming-Algorithmus, der echte Wörter erzeugt Stemming - Codebeispiele oder Open Source Projekte?

4
Wie berechnet man mit scikit learn Präzision, Rückruf, Genauigkeit und f1-Score für den Fall mit mehreren Klassen?
Ich arbeite an einem Stimmungsanalyseproblem. Die Daten sehen folgendermaßen aus: label instances 5 1190 4 838 3 239 1 204 2 127 Meine Daten sind also unausgeglichen, da 1190 instancesmit gekennzeichnet sind 5. Für die Klassifizierung verwende ich den SVC von scikit . Das Problem ist, dass ich nicht weiß, …

3
Wie trainiere ich den Stanford Parser mit Genia Corpus?
Ich habe einige Probleme, ein neues Modell für Stanford Parser zu erstellen. Ich habe auch die letzte Version von Stanford heruntergeladen: http://nlp.stanford.edu/software/lex-parser.shtml Und hier Genia Corpus in 2 Formaten, xml und ptb (Penn Treebank). Standford Parser kann mit ptd-Dateien trainieren. dann habe ich Genia Corpus heruntergeladen, weil ich mit biomedizinischem …
93 java  nlp  stanford-nlp 

23
Wie kann ich einem Wort „a“ und „an“ richtig voranstellen?
Ich habe eine .NET-Anwendung, in der bei einem bestimmten Substantiv das Wort "a" oder "an" korrekt vorangestellt werden soll. Wie würde ich das machen? Bevor Sie glauben, dass die Antwort darin besteht, einfach zu überprüfen, ob der erste Buchstabe ein Vokal ist, sollten Sie folgende Sätze berücksichtigen: ein ehrlicher Fehler …
92 c#  nlp  linguistics 


3
Gibt es eine gute Bibliothek zur Verarbeitung natürlicher Sprache [geschlossen]
Diese Frage passt derzeit nicht zu unserem Q & A-Format. Wir erwarten, dass die Antworten durch Fakten, Referenzen oder Fachwissen gestützt werden, aber diese Frage wird wahrscheinlich zu Debatten, Argumenten, Umfragen oder erweiterten Diskussionen führen. Wenn Sie der Meinung sind, dass diese Frage verbessert und möglicherweise erneut geöffnet werden kann, …
90 java  nlp 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.