Ich habe also einen Datensatz, dessen Verwendung ich Stoppwörter entfernen möchte
stopwords.words('english')
Ich habe Probleme damit, dies in meinem Code zu verwenden, um diese Wörter einfach herauszunehmen. Ich habe bereits eine Liste der Wörter aus diesem Datensatz. Der Teil, mit dem ich zu kämpfen habe, besteht darin, mit dieser Liste zu vergleichen und die Stoppwörter zu entfernen. Jede Hilfe wird geschätzt.
from nltk.corpus import stopwords
für zukünftige Googler
nltk.download("stopwords")
werden, um das Stoppwortwörterbuch verfügbar zu machen.