Ich arbeite seit einiger Zeit in NLTK mit Python. Das Problem, mit dem ich konfrontiert bin, ist, dass beim Training von NER in NLTK mit meinen benutzerdefinierten Daten keine Hilfe verfügbar ist. Sie haben MaxEnt verwendet und es auf ACE-Korpus trainiert. Ich habe viel im Internet gesucht, aber ich konnte keine Möglichkeit finden, NLTKs NER zu trainieren.
Wenn mir jemand einen Link / Artikel / Blog usw. zur Verfügung stellen kann, der mich zum Trainingsdatensatzformat weiterleitet, das beim Training von NLTKs NER verwendet wird, damit ich meine Datensätze in diesem bestimmten Format vorbereiten kann. Und wenn ich auf einen Link / Artikel / Blog usw. verwiesen werde, der mir helfen kann, NLTKs NER für meine eigenen Daten zu trainieren.
Diese Frage wird häufig gesucht und am wenigsten beantwortet. Könnte für jemanden in der Zukunft hilfreich sein, der mit NER zusammenarbeitet.