Zum Experimentieren möchten wir das in vielen Tweets eingebettete Emoji als Grundlage für Wahrheitsdaten / Trainingsdaten für eine einfache quantitative Analyse der Senitierung verwenden. Tweets sind normalerweise zu unstrukturiert, als dass NLP gut funktionieren könnte.
Auf jeden Fall gibt es 722 Emoji in Unicode 6.0 und wahrscheinlich werden weitere 250 in Unicode 7.0 hinzugefügt.
Gibt es eine Datenbank (wie zB SentiWordNet), die Sentiment-Annotationen für sie enthält?
(Beachten Sie, dass SentiWordNet auch mehrdeutige Bedeutungen zulässt . Betrachten Sie zB lustig , was nicht nur positiv ist: "das schmeckt lustig" ist wahrscheinlich nicht positiv ... dasselbe gilt ;-)
zum Beispiel. Aber ich denke nicht, dass dies schwieriger ist für Emoji als für normale Wörter ...)
Wenn Sie Erfahrung damit haben, sie für die Stimmungsanalyse zu verwenden, würde ich mich freuen, von Ihnen zu hören.