Ich versuche visuell zu vergleichen, wie drei verschiedene Nachrichtenpublikationen verschiedene Themen abdecken (bestimmt durch ein LDA-Themenmodell). Ich habe dazu zwei verwandte Methoden, aber viele Rückmeldungen von Kollegen erhalten, dass dies nicht sehr intuitiv ist. Ich hoffe, dass jemand da draußen eine bessere Idee hat, dies zu visualisieren.
In der ersten Grafik zeige ich die Proportionen der einzelnen Themen in jeder Veröffentlichung wie folgt:
Dies ist für fast alle, mit denen ich gesprochen habe, ziemlich einfach und intuitiv. Es ist jedoch schwierig, die Unterschiede zwischen den Veröffentlichungen zu erkennen. Welche Zeitung behandelt welches Thema mehr?
Um dies zu erreichen, habe ich den Unterschied zwischen der Publikation mit dem höchsten und dem zweithöchsten Anteil an Themen grafisch dargestellt, die von der Publikation mit dem höchsten Anteil gefärbt wurden. So was:
Die riesige Bar für Fußball ist also in Wirklichkeit die Entfernung zwischen al-Ahram English und Daily News Egypt (Nummer 2 in der Fußballberichterstattung), und sie ist rot gefärbt, weil Al-Ahram die Nummer 1 ist. In ähnlicher Weise sind Studien grün, da Egypt Independent den höchsten Anteil hat und die Balkengröße der Abstand zwischen Egypt Independent und Daily News Egypt (erneut Nummer 2) ist.
Die Tatsache, dass ich das alles in zwei Absätzen erklären muss, ist ein ziemlich sicheres Zeichen dafür, dass das Diagramm den Autarkietest nicht besteht. Es ist schwer zu sagen, was wirklich los ist, wenn man es nur ansieht.
Haben Sie allgemeine Vorschläge, wie Sie die dominierende Publikation für jedes Thema intuitiver hervorheben können?
Bearbeiten: Daten zum Spielen: Hier ist die dput
Ausgabe von R sowie eine CSV-Datei .
Bearbeiten 2: Hier ist eine vorläufige Version des Punktdiagramms mit den Durchmessern der Punkte, die proportional zum Anteil des Themas im Korpus sind (so wurden die Themen ursprünglich sortiert). Obwohl ich noch ein bisschen mehr daran arbeiten muss, fühlt es sich viel intuitiver an als das, was ich vorher getan habe. Vielen Dank an alle!