Hessischer Wert der Profilwahrscheinlichkeit, der für die Standardfehlerschätzung verwendet wird


13

Diese Frage ist von dieser motiviert . Ich habe zwei Quellen nachgeschlagen und das habe ich gefunden.

A. van der Vaart, Assymptotische Statistik:

Es ist selten möglich, eine Profilwahrscheinlichkeit explizit zu berechnen, aber ihre numerische Auswertung ist oft machbar. Dann kann die Profilwahrscheinlichkeit dazu dienen, die Dimension der Wahrscheinlichkeitsfunktion zu reduzieren. Profilwahrscheinlichkeitsfunktionen werden häufig auf die gleiche Weise wie (gewöhnliche) Wahrscheinlichkeitsfunktionen parametrischer Modelle verwendet. Abgesehen von ihren Punkten maximalen wobei als Schätzer & thgr , die zweite Ableitung bei θ wird als Schätzwert von minus dem Inversen der asymptotischen Kovarianzmatrix e verwendet. Neuere Forschungen scheinen diese Praxis zu bestätigen.θ^θ^

J. Wooldridge, Ökonometrische Analyse von Querschnitts- und Paneldaten (in beiden Ausgaben gleich):

Als Gerät zur Untersuchung asymptotischer Eigenschaften ist die konzentrierte Zielfunktion von begrenztem Wert, da Allgemeinen von ganz W abhängt. In diesem Fall kann die Zielfunktion nicht als Summe unabhängiger, identisch verteilter Summanden geschrieben werden. Eine Einstellung, bei der Gleichung (12.89) eine Summe von iid-Funktionen ist, tritt auf, wenn wir individuelle Effekte aus bestimmten nichtlinearen Paneldatenmodellen herausarbeiten. Darüber hinaus kann die konzentrierte Zielfunktion nützlich sein, um die Äquivalenz scheinbar unterschiedlicher Schätzungsansätze festzustellen.G(W,β)W

Wooldridge erörtert das Problem im weiteren Kontext von M-Schätzern, sodass es auch für Maximum-Likelihood-Schätzer gilt.

So erhalten wir zwei unterschiedliche Antworten auf die gleiche Frage. Der Teufel steckt meiner Meinung nach im Detail. Für einige Modelle können wir Hessisch der Profilwahrscheinlichkeit sicher verwenden, für einige Modelle nicht. Gibt es allgemeine Ergebnisse, die Bedingungen angeben, wann wir das tun können (oder nicht)?


Diese Passagen scheinen überhaupt nicht die gleiche Frage zu beantworten: Die erste betrifft die numerische Berechnung für einen bestimmten Datensatz, während die zweite "Untersuchung asymptotischer Eigenschaften" betrifft. Die Verwendung des Hessischen ist in der Regel eine rein mathematische Überlegung mit in der Regel einfachen Antworten: Siehe unsere verwandte Diskussion .
Whuber

van der Vaart sagt, dass Hessisch zur Berechnung der asymptotischen Kovarianzmatrix verwendet wird. Da Wooldridge davon spricht, dass die konzentrierte Zielfunktion nicht zur Untersuchung asymptotischer Eigenschaften verwendet werden kann, impliziert dies, dass der Hessische Wert (numerisch) nicht zur Schätzung von Standardfehlern verwendet werden kann. Ich habe unsere Diskussion nicht vergessen, also nehme ich diese Passage mit dem Salzkorn. Weder van der Vaart noch Wooldridge gaben jedoch Hinweise. Bevor ich die umfangreichen Nachforschungen anstellte, wollte ich nur überprüfen, ob dies bekannt ist.
mpiktas

Hervorragender Punkt: Irgendwie habe ich das "Asymptotische" im Van-der-Vaart-Zitat übersehen. Es kann jedoch immer noch keinen Widerspruch geben: Wooldridge sagt lediglich, dass die offensichtliche einfache Rechtfertigung (iid summands) nicht verfügbar ist, um zu demonstrieren, dass der Ansatz von van der Vaart funktioniert; Wooldridge sagt nicht, dass es nicht funktioniert ;-).
whuber

@whuber, ja, aber er sagt auch nicht, dass es funktioniert :) Mir ist bewusst, dass es keinen Widerspruch geben könnte, ich möchte nur wissen, ob es bestimmte Ergebnisse gibt.
mpiktas

2
Siehe On Profile Likelihood (SA Murphy und AW van der Vaart), jstor.org/pss/2669386
whuber

Antworten:


1

Für einige Modelle können wir Hessisch der Profilwahrscheinlichkeit sicher verwenden, für einige Modelle nicht

Leider ist das momentan so und es ist unwahrscheinlich, dass sich daran etwas ändert.

Die klarste Diskussion, die mir bekannt ist, sind die Regeln der bedingten Folgerung: Gibt es eine universelle Definition von Nicht-Information? B Jørgensen - Statistical Methods & Applications, 1994.

Und für einige der Probleme, die spezifisch für die Behebung von Profilwahrscheinlichkeitsfehlern sind, Stafford, JE (1996). Eine robuste Anpassung der Profilwahrscheinlichkeit, Annals of Statistics, 24, 336-52.


1

Eine schnelle Antwort: Dies wird in Kapitel 3 von OE Barndorff-Nielsen & DR Cox: Inferenz und Asymptotik, Chapman & Hall, Seite 90, Gleichung 3.31, besprochen, die sie Patefield zuschreiben. Sie schließen daraus, dass dies für einen skalaren Parameter gültig ist (sie analysieren keine anderen Fälle).

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.