Als «nlp» getaggte Fragen

Die Verarbeitung natürlicher Sprache (NLP) ist ein Teilbereich der künstlichen Intelligenz, in dem nützliche Informationen aus Daten natürlicher Sprache transformiert oder extrahiert werden. Zu den Methoden gehören maschinelles Lernen und regelbasierte Ansätze.




3
Erstellen eines neuen Korpus mit NLTK
Ich rechnete damit, dass die Antwort auf meinen Titel oft darin besteht, die Dokumentationen zu lesen, aber ich habe das NLTK-Buch durchgesehen aber es gibt keine Antwort. Ich bin ein bisschen neu in Python. Ich habe eine Reihe von .txtDateien und möchte die Korpusfunktionen verwenden können, die NLTK für den …
83 python  nlp  nltk  corpus 

3
Praktische Beispiele für die Verwendung von NLTK [geschlossen]
Diese Frage passt derzeit nicht zu unserem Q & A-Format. Wir erwarten, dass die Antworten durch Fakten, Referenzen oder Fachwissen gestützt werden, aber diese Frage wird wahrscheinlich zu Debatten, Argumenten, Umfragen oder erweiterten Diskussionen führen. Wenn Sie der Meinung sind, dass diese Frage verbessert und möglicherweise erneut geöffnet werden kann, …
78 python  nlp  nltk 

5
Stoppwortentfernung mit NLTK
Ich versuche, einen vom Benutzer eingegebenen Text durch Entfernen von Stoppwörtern mit dem nltk-Toolkit zu verarbeiten, aber beim Entfernen von Stoppwörtern werden die Wörter "und", "oder", "nicht" entfernt. Ich möchte, dass diese Wörter nach dem Entfernen des Stoppworts vorhanden sind, da es sich um Operatoren handelt, die für die spätere …
76 python  nlp  nltk  stop-words 


3
Stemmers vs Lemmatizers
Natural Language Processing (NLP), insbesondere für Englisch, hat sich zu einem Stadium entwickelt, in dem Stemming zu einer archaischen Technologie werden würde, wenn "perfekte" Lemmatisatoren existieren. Dies liegt daran, dass Stemmers die Oberflächenform eines Wortes / Tokens in bedeutungslose Stängel verwandeln. Andererseits ist die Definition des "perfekten" Lemmatisierers fraglich, da …

3
Was genau macht die Keras Tokenizer-Methode?
Gelegentlich erfordern die Umstände Folgendes: from keras.preprocessing.text import Tokenizer tokenizer = Tokenizer(num_words=my_max) Dann singen wir immer dieses Mantra: tokenizer.fit_on_texts(text) sequences = tokenizer.texts_to_sequences(text) Obwohl ich (mehr oder weniger) verstehe, was der Gesamteffekt ist, kann ich nicht herausfinden, was jeder einzeln tut, unabhängig davon, wie viel Forschung ich mache (einschließlich natürlich der …
74 python  keras  nlp 


4
Fuzzy String Vergleich
Was ich vervollständigen möchte, ist ein Programm, das eine Datei einliest und jeden Satz gemäß dem ursprünglichen Satz vergleicht. Der Satz, der perfekt zum Original passt, erhält eine Punktzahl von 1 und ein Satz, der das Gegenteil ist, erhält eine 0. Alle anderen Fuzzy-Sätze erhalten eine Note zwischen 1 und …

3
So erstellen Sie eine semantische Suche für eine bestimmte Domain
Es gibt ein Problem, das wir zu lösen versuchen, wenn wir eine semantische Suche in unserem Datensatz durchführen möchten, dh wir haben domänenspezifische Daten (Beispiel: Sätze, die über Automobile sprechen) Unsere Daten sind nur eine Reihe von Sätzen. Wir möchten einen Satz geben und die folgenden Sätze zurückerhalten: Ähnlich wie …

2
Extrahieren Sie Textinformationen aus PDF-Dateien mit unterschiedlichen Layouts - maschinelles Lernen
Ich benötige Unterstützung bei einem ML-Projekt, das ich gerade erstellen möchte. Ich erhalte viele Rechnungen von vielen verschiedenen Lieferanten - alle in ihrem eigenen Layout. Ich muss 3 Schlüsselelemente aus den Rechnungen extrahieren . Diese 3 Elemente befinden sich alle in einer Tabelle / Werbebuchung für alle Rechnungen. Die 3 …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.