Was sind die Nachteile der Profilwahrscheinlichkeit?


19

Betrachten wir einen Vektor von Parametern , mit den Parameter von Interesse, und ein Störparameter.θ 1 θ 2(θ1,θ2)θ1θ2

Wenn die Wahrscheinlichkeit , dass aus den Daten aufgebaut ist x , die Profil Wahrscheinlichkeit für θ 1 ist definiert als L P ( θ 1 ; x ) = L ( θ 1 , θ 2 ( θ 1 ) ; x ) wobei θ 2 ( θ 1 ) ist das MLE von θ 2L(θ1,θ2;x)xθ1LP(θ1;x)=L(θ1,θ^2(θ1);x)θ^2(θ1)θ2für einen festen Wert von .θ1

Maximierung des LikelihoodProfil in Bezug auf & thgr; 1 auf gleiche Schätzung führt θ 1 wie die durch Maximieren der Wahrscheinlichkeitgleichzeitig in Bezugerhalt & thgr; 1 und & thgr; 2 .θ1θ^1θ1θ2

Ich denkedie Standardabweichung von & theta; 1 auch aus der zweiten Ableitung des Profils Wahrscheinlichkeit abgeschätzt werden kann.θ^1

Die Wahrscheinlichkeit Statistik für H 0 : θ 1 = θ 0 kann bezüglich des Profils Wahrscheinlichkeit geschrieben werden: L R = 2 log ( L P ( θ 1 ; x )H0:θ1=θ0.LR=2log(LP(θ^1;x)LP(θ0;x))

Es scheint also, dass die Profilwahrscheinlichkeit genau so verwendet werden kann, als wäre es eine echte Wahrscheinlichkeit. Ist es wirklich so? Was sind die Hauptnachteile dieses Ansatzes? Und was ist mit dem 'Gerücht', dass der aus der Profilwahrscheinlichkeit erhaltene Schätzer voreingenommen ist (edit: sogar asymptotisch)?


2
Nur eine Anmerkung, die Schätzer aus der Wahrscheinlichkeit können auch voreingenommen sein, das klassische Beispiel ist die Schätzung der Wahrscheinlichkeitsvarianz für eine normale Stichprobe.
mpiktas

@mpiktas: Danke für deinen Kommentar. In der Tat kann das klassische mle auch voreingenommen sein. Ich werde die Frage bearbeiten, um die Dinge klarer zu machen.
22.

Was ist die assymptotische Voreingenommenheit? Sprechen Sie über nicht konsistente Schätzer?
mpiktas

@mpiktas: Ja, das hätte ich sagen sollen ...
22.

Antworten:


14

Die Schätzung von aus der Profilwahrscheinlichkeit ist nur die MLE. Das Maximieren in Bezug auf & thgr ; 2 für jedes mögliche & thgr; 1 und das anschließende Maximieren in Bezug auf & thgr; 1 ist dasselbe wie das gemeinsame Maximieren in Bezug auf ( & thgr; 1 , & thgr ; 2 ) .θ1θ2θ1θ1(θ1,θ2)

Der Schlüssel Schwäche ist , dass, wenn Sie Ihre Schätzung der SE von Basis θ 1 auf die Krümmung des Profils Wahrscheinlichkeit, Sie sind die Buchführung nicht in vollem Umfang für die Unsicherheit in R 2 .θ^1θ2

McCullagh und Nelder, Generalized Linear Models, 2. Auflage , haben einen kurzen Abschnitt über die Profilwahrscheinlichkeit (Abschnitt 7.2.4, S. 254-255). Man sagt:

[A] ungefähre Konfidenzsätze können auf übliche Weise erhalten werden. Solche Konfidenzintervalle sind häufig zufriedenstellend, wenn [die Dimension von ] im Verhältnis zur gesamten Fisher-Information klein ist, andernfalls jedoch irreführend ist. .. Leider ist [die Profil-Log-Wahrscheinlichkeit] keine Log-Wahrscheinlichkeitsfunktion im üblichen Sinne. Am offensichtlichsten ist, dass die Ableitung keinen Mittelwert von Null hat, eine Eigenschaft, die für die Schätzung von Gleichungen wesentlich ist.θ2


Ich danke Ihnen sehr für Ihre Antwort. Lassen Sie mich vor der Annahme noch etwas fragen. Was sind die Implikationen von & le ; ElP(θ1)θ10
22.

Interessante Frage, obwohl es eine Reise zum Bücherregal erforderte (was ich sowieso hätte tun sollen). Ich habe meiner Antwort zu diesem Punkt ein wenig hinzugefügt.
Karl

Vielen Dank für die Bearbeitung. Es wird gesagt, dass die Eigenschaft (die beim wahren Parameterwert bewertete Punktzahl hat den Mittelwert Null) für die Schätzung von Gleichungen wesentlich ist. Obwohl die Wahrscheinlichkeit des Profilprotokolls diese Eigenschaft nicht erfüllt, wird die MLE erstellt. Gibt es etwas, das ich vermisse?
23.

Diese Eigenschaft ist für die Bereitstellung des MLE nicht erforderlich.
Karl
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.