Stimmungsdaten für Emoji

Zum Experimentieren möchten wir das in vielen Tweets eingebettete Emoji als Grundlage für Wahrheitsdaten / Trainingsdaten für eine einfache quantitative Analyse der Senitierung verwenden. Tweets sind normalerweise zu unstrukturiert, als dass NLP gut funktionieren könnte.

Auf jeden Fall gibt es 722 Emoji in Unicode 6.0 und wahrscheinlich werden weitere 250 in Unicode 7.0 hinzugefügt.

Gibt es eine Datenbank (wie zB SentiWordNet), die Sentiment-Annotationen für sie enthält?

(Beachten Sie, dass SentiWordNet auch mehrdeutige Bedeutungen zulässt . Betrachten Sie zB lustig , was nicht nur positiv ist: "das schmeckt lustig" ist wahrscheinlich nicht positiv ... dasselbe gilt ;-)zum Beispiel. Aber ich denke nicht, dass dies schwieriger ist für Emoji als für normale Wörter ...)

Wenn Sie Erfahrung damit haben, sie für die Stimmungsanalyse zu verwenden, würde ich mich freuen, von Ihnen zu hören.

machine-learning classification parsing

— Erich Schubert
quelle

Glaube nicht, dass so etwas derzeit existiert, aber würde es lieben, wenn du etwas dafür zusammenstellst!

— 12.

Erich Schubert, ich suche genau das Gleiche! Hattest du eine Chance, eine nützliche Ressource dafür zu finden?

— Saeed Mehrabi

Antworten:

Insgesamt 972 Emoji sind nicht wirklich so groß, um sie nicht manuell beschriften zu können, aber ich bezweifle, dass sie als gute Grundwahrheit funktionieren werden. Quellen wie Twitter sind voller Ironie, Sarkasmus und anderer kniffliger Situationen, in denen emotionale Symbole (wie Emoji oder Emoticon) etwas anderes bedeuten als normale Interpretationen. Zum Beispiel kann jemand schreiben "xxx betrogen ihre Kunden, und jetzt sind sie selbst betrogen! Ha ha ha!: D". Dies ist definitiv ein negativer Kommentar, aber der Autor freut sich, xxx company in Schwierigkeiten zu sehen und fügt somit ein positives Emoticon hinzu. Diese Fälle sind nicht so häufig, aber definitiv nicht geeignet für die Grundwahrheit.

Viel häufiger wird Emoticon als Ausgangswert für die Erfassung des tatsächlichen Datensatzes verwendet . In diesem Artikel verwenden Autoren beispielsweise Emoticon- und emotionale Hash-Tags, um ein Lexikon mit Wörtern zu finden, die für die weitere Klassifizierung nützlich sind.

— freund
quelle

Eigentlich stimme ich nicht zu. Da der Autor sie gerne in Schwierigkeiten hat, ist dies eine positive Einstellung. Es ist ein negativer Kommentar zum Unternehmen, aber dennoch eine positive Einstellung des Autors. In diesem einfacheren Szenario (ich sage nicht, dass dies das vollständige Ziel ist) klingt es für mich nach einer vernünftigen Aufgabe , vorherzusagen, welche Emojis ein Benutzer zu seinem Beitrag hinzufügen würde . In der Tat können Sie viele Fälle konstruieren, in denen das Emoji wesentlich sein wird. Betrachten Sie "Got f_cked :-)" im Gegensatz zu "Got f_cked. :-("

— Erich Schubert

Wenn Sie versuchen, die Emotionen einer Person im Gegensatz zur Einstellung einer Person zu einem Thema einzuschätzen, funktioniert dieses Beispiel nicht. Es gibt aber noch viele andere. Sarkasmus ist weit verbreitet. Betrachten Sie den Satz "oh yeah, Sie sind echte" Meister ";)". Der Mensch kann einen negativen Kontext erfassen, aber ein positives Emoticon zeigt auf eine positive Emotion. Aber ich habe es nicht wirklich verstanden: Möchten Sie subjektive Informationen aus Tweets extrahieren oder nur mögliche Emojis vorhersagen? Auch wenn sie sich ähnlich anhören, geht es bei der zweiten Aufgabe nicht wirklich um die Stimmungsanalyse. Zumindest nicht direkt.

— Freund

Der "Augenzwinkern" -Smiley wird normalerweise nicht als "positiv", sondern als "ironisch" eingestuft. Aus diesem Grund ist ein gutes Wörterbuch wie SentiWordNet sinnvoll. Wenn Sie in SentiWordNet nachschlagen, hat dies auch mehrere Bedeutungen! sentiwordnet.isti.cnr.it/search.php?q=funny (Es ist also nicht trivial, sie manuell zu kommentieren, da es nicht so einfach wie positiv / negativ ist; Sie sollten jedoch die übliche Validierung der Interrater-Vereinbarung usw. durchführen.)

— Erich Schubert

Jetzt sehe ich deine Idee. Aber ich glaube nicht, dass es funktionieren wird, nur weil (die meisten) Emojis für mich nicht wirklich nach guten Prädiktoren klingen und Sie ausdrücklich keine anderen Funktionen verwenden möchten. Wie auch immer, dies ist nur eine Meinung, die auf meinen Erfahrungen basiert. Nur Daten können echte Antworten geben. Viel Glück!

— Freund

Wer hat gesagt, dass ich keine anderen Funktionen verwenden möchte? Aber für diese habe ich Datenbanken gesehen ...

— Erich Schubert

Ich fand dieses Github-Repo nützlich (ein guter Anfang): https://github.com/wooorm/emoji-emotion Liste der Emoji, deren Wertigkeit mit einer ganzen Zahl zwischen minus fünf (negativ) und plus fünf (positiv) bewertet wurde.

Siehe Liste der unterstützten Unicode-Emojis: https://github.com/wooorm/emoji-emotion/blob/master/Support.md

Beachten Sie, dass einige Emoji möglicherweise verwirrende Polaritäten erhalten, z. B. stuck_out_tongue_closed_eyes (0), da sie sowohl für positive als auch für negative Emotionen verwendet werden.

— Tal Weiss
quelle