Ich bin etwas verwirrt. Kann mir jemand erklären, wie man die gegenseitige Information zwischen zwei Begriffen basierend auf einer Term-Dokument-Matrix mit dem Auftreten eines binären Terms als Gewichtung berechnet?
Vielen Dank
Ich bin etwas verwirrt. Kann mir jemand erklären, wie man die gegenseitige Information zwischen zwei Begriffen basierend auf einer Term-Dokument-Matrix mit dem Auftreten eines binären Terms als Gewichtung berechnet?
Vielen Dank
Antworten:
Wie wäre es mit einer gemeinsamen Wahrscheinlichkeitstabelle, die die normalisierten Co-Vorkommen in Dokumenten enthält? Dann können Sie anhand der Tabelle gemeinsame Entropie und marginale Entropien erhalten. Schließlich ist