Angenommen, ist eine Menge sich gegenseitig ausschließender Ergebnisse einer diskreten Zufallsvariablen und ist eine Dienstprogrammfunktion, bei der , usw. ist.f 0 < f ( ω ) ≤ 1 ∑ Ω f ( ω ) = 1
Wenn gleichmäßig über verteilt und a ist Wahrscheinlichkeitsmassenfunktion , die Shannon - Entropie ist , maximiert ( , und wenn ein Element in die gesamte Masse von , wird die Shannon-Entropie minimiert ( tatsächlich ). Dies entspricht Intuitionen über Überraschung (oder Unsicherheitsreduzierung ) und Ergebnisse und Unsicherheit (oder erwartete Überraschung ) und Zufallsvariablen:Ω f =log| Ω| )Ωf0
- Wenn gleichmäßig verteilt ist, wird die Unsicherheit maximiert, und je mehr Ergebnisse es gibt, dass die Masse gleichmäßig verteilt wird, desto unsicherer sind wir.
- Wenn seine gesamte Masse in einem Ergebnis konzentriert hat, haben wir keine Unsicherheit.
- Wenn wir einem Ergebnis eine Wahrscheinlichkeit von zuweisen , erhalten wir keine Informationen (sind "nicht überrascht"), wenn wir sie tatsächlich beobachten.
- Wenn wir einem Ergebnis eine Wahrscheinlichkeit zuweisen , die immer näher an , wird die Beobachtung des tatsächlichen Auftretens immer informativer ("überraschend").
(Dies alles sagt natürlich nichts über die viel konkretere - aber weniger epistemische - Kodierungsinterpretation von Shannon-Informationen / Entropie aus.)
Wenn jedoch die Interpretation einer Dienstprogrammfunktion hat , gibt es eine sinnliche Interpretation von oder ? Es scheint mir, dass es Folgendes geben könnte:l o g 1 ∑f(ω)log1
- Wenn als PMF eine gleichmäßige Verteilung über , entspricht als Nutzenfunktion der Gleichgültigkeit gegenüber den Ergebnissen, die nicht größer sein könnten *Ω f
- Eine Nutzenfunktion, bei der ein Ergebnis den gesamten Nutzen hat und der Rest keine (so verzerrt wie möglich), entspricht sehr starken relativen Präferenzen - einem Mangel an Gleichgültigkeit.
Gibt es eine Referenz, die dies erweitert? Habe ich etwas über die Einschränkungen beim Vergleich von Wahrscheinlichkeitsmassenfunktionen und normalisierten relativen Dienstprogrammen über diskrete Zufallsvariablen übersehen?
* Ich bin mir der Indifferenzkurven bewusst und sehe aus verschiedenen Gründen nicht, wie sie für meine Frage relevant sein könnten, angefangen mit meinem Fokus auf einen kategorialen Probenraum und der Tatsache, dass ich nicht an 'Indifferenz' an sich interessiert bin. sondern wie man Dienstprogramme als Wahrscheinlichkeiten interpretiert und wie man Funktionen auf Wahrscheinlichkeiten interpretiert, wenn die fragliche (diskrete) 'Wahrscheinlichkeitsverteilung' tatsächlich oder (zusätzlich) die Interpretation einer Nutzenfunktion hat.