Es gibt keine beste Anzahl von Behältern, um die gegenseitige Information (MI) mit Histogrammen zu schätzen. Der beste Weg ist, es durch Kreuzvalidierung auszuwählen, wenn Sie können, oder sich auf eine Faustregel zu verlassen. Dies ist der Grund, warum viele andere Schätzer des MI vorgeschlagen wurden, die nicht auf Histogrammen basieren.
Die Anzahl der Fächer hängt von der Gesamtzahl der Datenpunkte . Sie sollten versuchen, zu viele Bins zu vermeiden, um Schätzfehler für die gemeinsame Verteilung zwischen den beiden Variablen zu vermeiden. Sie sollten auch zu wenige Bins vermeiden, um die Beziehung zwischen den beiden Variablen erfassen zu können. Da ein 2D - Histogramm mit erzeugt gleicher Breite Bins für beide und ich persönlich würde wählen:
D = Mehr ⌊ Sonstiges √nnp.histogram2d(x, y, D)
D
x
y
In diesem Fall haben Sie im Durchschnitt für zwei gleichmäßig verteilte Zufallsvariablen mindestensPunkte für jede Zelle des Histogramms:
Dies ist eine mögliche Wahl, die den in(Cellucci, 2005)vorgeschlagenen Ansatz der adaptiven Partitionierung simuliert. Der letztere Ansatz wird häufig verwendet, um den MI zu schätzen, um auf genetische Netzwerke zu schließen: z.B. inMIDER.
D=⌊n/5−−−√⌋
n5nDXDY≥5⇒nD2≥5⇒D2≤n/5⇒D=⌊n/5−−−√⌋
Wenn Sie viele Datenpunkte und keine fehlenden Werte haben, sollten Sie sich nicht zu viele Sorgen machen, um die beste Anzahl von Fächern zu finden. zB wenn . Wenn dies nicht der Fall ist, können Sie den MI für endliche Stichproben korrigieren. (Steuer et al., 2002) diskutiert eine Korrektur für MI für die Aufgabe der genetischen Netzwerkinferenz.n = 100 , 000nn=100,000
Das Schätzen der Anzahl der Fächer für ein Histogramm ist ein altes Problem. Dieser Vortrag von Lauritz Dieckman über die Schätzung der Anzahl der Behälter für MI könnte Sie interessieren . Dieser Vortrag basiert auf einem Kapitel in Mike X Cohens Buch über neuronale Zeitreihen.
Sie können und unabhängig und die Faustregel verwenden, die zum Schätzen der Anzahl der Fächer in 1D-Histogrammen verwendet wird.D Y.DXDY
Freedman-Diaconis-Regel (keine Annahme bezüglich der Verteilung):
DX=⌈maxX−minX2⋅IQR⋅n−1/3⌉
wobei der Unterschied zwischen dem 75-Quantil und dem 25-Quantil ist. Schauen Sie sich diese verwandte Frage in
SE an .
IQR
Scotts Regel (Normalitätsannahme):
wobei die Standardabweichung ist für .
DX=⌈maxX−minX3.5⋅sX⋅n−1/3⌉
sXX
Sturges-Regel (könnte die Anzahl der Fächer unterschätzen, ist aber gut für große ):
n
DX=⌈1+log2n⌉
Es ist schwierig, den MI mit Histogrammen korrekt abzuschätzen. Sie können dann einen anderen Schätzer auswählen:
- Kraskov des NN - Schätzer, der ein bisschen weniger empfindlich auf Parameterwahl: oder nächste Nachbarn wird oft als Standard verwendet. Papier: (Kraskov, 2003)kk=4k=6
- Abschätzung des MI mit Kerneln (Moon, 1995) .
Es gibt viele Pakete zur Schätzung des MI:
- Nichtparametrische Entropie-Schätz-Toolbox für Python. Website .
- Information-Dynamics-Toolkit in Java, aber auch für Python verfügbar. Website .
- ITE-Toolbox in Matlab. Website .