Betrachten Sie eine Bernoulli-Zufallsvariable mit dem Parameter (Erfolgswahrscheinlichkeit). Die Wahrscheinlichkeitsfunktion und die Fisher-Information (eine Matrix) sind:
Betrachten Sie nun eine " " Version mit zwei Parametern: der Erfolgswahrscheinlichkeit und der Ausfallwahrscheinlichkeit . (Beachten Sie, dass ist und diese Einschränkung impliziert, dass einer der Parameter redundant ist.) In diesem Fall sind die Wahrscheinlichkeitsfunktion und die Fisher-Informationsmatrix (FIM):
Beachten Sie, dass die Determinanten dieser beiden FIMs identisch sind. Darüber hinaus erstreckt sich diese Eigenschaft auf den allgemeineren Fall kategorialer Modelle (dh mehr als zwei Zustände). Es scheint sich auch auf logarithmisch lineare Modelle mit verschiedenen Teilmengen von Parametern zu erstrecken, die auf Null beschränkt sind. In diesem Fall entspricht der zusätzliche "redundante" Parameter der Protokollpartitionsfunktion, und die Äquivalenz der beiden FIM-Determinanten kann basierend auf dem Schur-Komplement der größeren FIM gezeigt werden. (Bei logarithmisch linearen Modellen ist die kleinere FIM nur das Schur-Komplement der größeren FIM.)
Kann jemand erklären, ob sich diese Eigenschaft auf einen größeren Satz parametrischer Modelle erstreckt (z. B. auf alle Exponentialfamilien) und die Möglichkeit bietet, die FIM-Determinanten basierend auf einem solchen "erweiterten" Satz von Parametern abzuleiten? Das heißt, es wird jedes gegebene statistische Modell mit Parametern angenommen, die auf einer dimensionalen Mannigfaltigkeit liegen, die in einen -dimensionalen Raum eingebettet ist. Wenn wir nun den Parametersatz um eine weitere Dimension erweitern (die basierend auf den anderen vollständig eingeschränkt ist) und die FIM-basierten Parameter berechnen , erhalten wir immer dieselbe Determinante wie die auf dem Original basierende (unabhängige) Parameter? Wie hängen diese beiden FIMs zusammen?n ( n + 1 ) ( n + 1 ) n
Der Grund, warum ich diese Frage stelle, ist, dass die FIM mit dem zusätzlichen Parameter oft einfacher erscheint. Mein erster Gedanke ist, dass dies im Allgemeinen nicht funktionieren sollte. Die FIM beinhaltet die Berechnung partieller Ableitungen der Log-Wahrscheinlichkeit für jeden Parameter. Diese partiellen Ableitungen gehen davon aus, dass, während sich der betreffende Parameter ändert, alle anderen Parameter konstant bleiben, was nicht wahr ist, wenn wir den zusätzlichen (eingeschränkten) Parameter einbeziehen. In diesem Fall scheinen mir die partiellen Ableitungen nicht mehr gültig zu sein, da wir nicht davon ausgehen können, dass die anderen Parameter konstant sind. Ich habe jedoch noch keine Beweise dafür gefunden, dass dies tatsächlich ein Problem ist. (Wenn partielle Ableitungen in Fällen mit abhängigen Parametern problematisch sind, handelt es sich um Gesamtableitungenstattdessen benötigt? Ich habe noch kein Beispiel für die Berechnung der FIM mit Gesamtableitungen gesehen, aber vielleicht ist das die Lösung ...)
Das einzige Beispiel, das ich online finden konnte, um die FIM basierend auf einem solchen "erweiterten" Parametersatz zu berechnen, ist das folgende: Diese Hinweise enthalten ein Beispiel für die kategoriale Verteilung, wobei die erforderlichen partiellen Ableitungen wie üblich berechnet werden (dh als ob jeder Parameter unabhängig wäre , obwohl eine Einschränkung zwischen den Parametern vorhanden ist).