Gegenseitige Information als Wahrscheinlichkeit


11

Könnte die gegenseitige Information über die Gelenkentropie:

0I(X,Y)H(X,Y)1

definiert werden als: "Die Wahrscheinlichkeit, eine Information von X nach Y zu übermitteln"?

Es tut mir leid, dass ich so naiv bin, aber ich habe noch nie Informationstheorie studiert, und ich versuche nur, einige Konzepte davon zu verstehen.


1
Willkommen im Lebenslauf, luca maggi! Was für eine schöne erste Frage!
Alexis

Antworten:


8

Die von Ihnen beschriebene Maßnahme wird als Information Quality Ratio (IQR) bezeichnet (Wijaya, Sarno und Zulaika, 2017). IQR ist die gegenseitige Information I(X,Y) geteilt durch "Gesamtunsicherheit" (gemeinsame Entropie) H(X,Y) (Bildquelle: Wijaya, Sarno und Zulaika, 2017).

enter image description here

Wie von Wijaya, Sarno und Zulaika (2017) beschrieben,

der IQR-Bereich ist [0,1] . Der größte Wert (IQR = 1) kann erreicht werden, wenn DWT ein Signal ohne Informationsverlust perfekt rekonstruieren kann. Andernfalls bedeutet der niedrigste Wert (IQR = 0), dass MWT nicht mit einem Originalsignal kompatibel ist. Mit anderen Worten, ein rekonstruiertes Signal mit einer bestimmten MWT kann keine wesentlichen Informationen enthalten und unterscheidet sich vollständig von den ursprünglichen Signaleigenschaften.

Sie können es als Wahrscheinlichkeit interpretieren, dass das Signal ohne Informationsverlust perfekt rekonstruiert wird . Beachten Sie, dass eine solche Interpretation eher der subjektivistischen Interpretation der Wahrscheinlichkeit als der traditionellen, frequentistischen Interpretation entspricht.

Es ist eine Wahrscheinlichkeit für ein binäres Ereignis (Rekonstruktion von Informationen vs. nicht), wobei IQR = 1 bedeutet, dass wir die rekonstruierten Informationen für vertrauenswürdig halten, und IQR = 0 das Gegenteil bedeutet. Es teilt alle Eigenschaften für Wahrscheinlichkeiten von binären Ereignissen. Außerdem, teilen Entropien eine Reihe anderer Eigenschaften mit Wahrscheinlichkeiten (z. B. Definition von bedingten Entropien, Unabhängigkeit usw.). Es sieht also nach einer Wahrscheinlichkeit aus und quakt wie es.


Wijaya, DR, Sarno, R. & Zulaika, E. (2017). Information Quality Ratio als neuartige Metrik für die Auswahl von Mutter-Wavelets. Chemometrics and Intelligent Laboratory Systems, 160, 59-71.


1
Wie wird die IQR-Funktion für definiert , um die definierenden Eigenschaften des Wahrscheinlichkeitsmaßes zu überprüfen? Führen Sie I ( X ' , Y ' ) und H ( X ' , Y ' ) mit X 'ein : = X I ( A ) ,AΩI(X,Y)H(X,Y) wobei I die charakteristische Funktion ist? X:=XI(A),Y:=YI(A)I
Hans

Nun, meine Frage richtet sich an einen Teil Ihrer Antwort und nicht an eine eigenständige Frage. Schlagen Sie vor, dass ich eine neue Frage öffne und sie verlinke und auf Ihre Antwort verweise?
Hans

@Hans Was ich gesagt habe, ist, dass diese Maßnahme leicht zur Definition passt, korrigiere mich, wenn ich falsch liege. Axiome 1. und 2. sind offensichtlich. Für Axiom 3 ist die Überlappung, H ( X , Y ) der Gesamtraum, so dass der Bruch leicht als Wahrscheinlichkeit angesehen werden kann. I(X,Y)H(X,Y)
Tim

1
Eine Wahrscheinlichkeit wird für einen Probenraum und sein Sigma-Feld . Ich bin verwirrt, was diese für dieses Wahrscheinlichkeitsmaß IQR sind. Es gibt bereits einen Probenraum und sein Sigma-Feld für das für die Zufallsvariablen X und Y definierte Wahrscheinlichkeitsmaß . Entspricht der Probenraum und das Feld des neuen Wahrscheinlichkeitsmaßes IQR denen des alten Wahrscheinlichkeitsmaßes für X und Y ? Wenn nicht, wie sind sie definiert? Oder sagen Sie, dass diese nicht definiert werden müssen? Wie vergleicht man es dann mit den Axiomen? (Ω,F)XYXY
Hans

@Hans Ich habe ausdrücklich darauf hingewiesen, dass dies mit Axiomen übereinstimmt, aber es ist schwer zu sagen, mit welcher Wahrscheinlichkeit dies genau sein würde. Die von mir vorgeschlagene Interpretation besteht wahrscheinlich darin, das Signal zu rekonstruieren. Dies ist keine Wahrscheinlichkeitsverteilung von X oder Y. Ich denke, Sie könnten tiefer in die Interpretation und das Verständnis eintauchen. Die Frage war, ob dies als Wahrscheinlichkeit interpretiert werden konnte und die Antwort war formal ja.
Tim

2

Hier ist die Definition eines Wahrscheinlichkeitsraums. Verwenden wir dort die Notationen. IQR ist eine Funktion eines Tupels (Ω,F,P,X,Y) (Die ersten drei Komponenten bilden den Wahrscheinlichkeitsraum, in dem die beiden Zufallsvariablen definiert sind). Ein Wahrscheinlichkeitsmaß muss eine festgelegte Funktion sein, die alle Bedingungen der in Tims Antwort aufgeführten Definition erfüllt. Man muss Θ:=(Ω,F,P,X,Y) als Teilmenge einer Menge Ω~ angeben . Darüber hinaus ist die Menge von Θ's muss ein Feld von Teilmengen von Ω~ , und dieser IQR(Ω,F,P,X,Y) muss alle drei Eigenschaften erfüllen, die in der Definition des in Tims Antwort aufgeführten Wahrscheinlichkeitsmaßes aufgeführt sind. Bis man ein solches Objekt konstruiert, ist es falsch zu sagen, dass IQR ein Wahrscheinlichkeitsmaß ist. Ich jedenfalls sehe die Nützlichkeit eines solch komplizierten Wahrscheinlichkeitsmaßes nicht (nicht die IQR-Funktion selbst, sondern als Wahrscheinlichkeitsmaß). IQR in dem in Tims Antwort zitierten Artikel wird nicht als Wahrscheinlichkeit, sondern als Metrik bezeichnet oder verwendet (Ersteres ist eine Art der letzteren, letzteres ist jedoch keine Art der ersteren.).

[0,1]ΘΩ~:={a,b}F~:=2Ω~P~(a):=IQR(Θ)Θ


(xi,yi)

Θ:=(Ω,F,P,X,Y)

Dies ist auch der Fall, wenn Sie am Ende ein kompliziertes neuronales Netzwerk mit Sigmoid-Aktivierungsfunktion verwenden. Können Sie nachweisen, dass die Ausgabe metrisch-theoretisch wahrscheinlich ist? Wir interpretieren dies jedoch oft als Wahrscheinlichkeit.
Tim

@ Tim: Natürlich kannst du. Mit der Pullback-Maßnahme ist dies leicht zu handhaben. Die Sigmoidfunktion ist eine messbare Funktion, die bereits die Sigma-Felder der Domäne und des Bereichs festlegt ([0,1]]mit dem (konventionellen) Borel-Feld) der Funktion. Das Wahrscheinlichkeitsmaß einer TeilmengeEIN des Probenraums P.(EIN): =μ(f(EIN)) wo μ ist das (konventionelle) Borel-Maß von R. und fist die Sigmoidfunktion. QED
Hans

Entschuldigung, aber ich fand diese Art von Diskussionen und Maßtheorie nie interessant, deshalb werde ich mich von der weiteren Diskussion zurückziehen. Ich sehe Ihren Standpunkt hier auch nicht, zumal Ihr letzter Absatz genau das zu sagen scheint, was ich von Anfang an gesagt habe.
Tim
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.