Suche nach einem theoretischen Verständnis der Firth Logistic Regression


13

Ich versuche, die logistische Regression von Firth zu verstehen (Methode zum Behandeln einer perfekten / vollständigen oder quasi vollständigen Trennung in der logistischen Regression), damit ich sie anderen in vereinfachten Begriffen erklären kann. Hat jemand eine abgedrehte Erklärung, welche Änderung Firth-Schätzung an MLE vornimmt?

Ich habe nach bestem Wissen Firth (1993) gelesen und verstehe, dass die Score-Funktion korrigiert wird. Ich bin mir nicht sicher, woher die Korrektur stammt und welche Begründung sie hat und welche Rolle die Score-Funktion bei MLE spielt.

Tut mir leid, wenn dies nur ansatzweise bekannt ist. Die Literatur, die ich durchgesehen habe, scheint ein viel tieferes Verständnis von MLE zu erfordern als ich.

Antworten:


11

Die Korrektur von Firth entspricht der Angabe von Jeffreys Prior und der Suche nach der Art der posterioren Verteilung. Grob gesagt wird dem Datensatz die Hälfte einer Beobachtung hinzugefügt, vorausgesetzt, die wahren Werte der Regressionsparameter sind gleich Null.

θ^nθ0θ0θn=θ0+O(n1/2)=θ0+v1n1/2+o(n1/2)v1σ12n(θ^nθ0)2/σ12χ12

o(n1/2)O(n1)1/n12lndetI(θ)1/n die durch die Stichprobeninformation in den Schatten gestellt wird.


Entschuldigung für mein Unverständnis, aber ich folge nicht ganz. Wenn Sie sagen "Grob gesagt, wird dem Datensatz die Hälfte einer Beobachtung hinzugefügt, vorausgesetzt, die wahren Werte der Regressionsparameter sind gleich Null." Warum würden Sie annehmen, dass die wahren Werte der Regressionsparameter gleich Null sind? Wie wird dem Datensatz eine halbe Beobachtung hinzugefügt?
ESmith5988

Aus dem Rest Ihrer Erklärung geht hervor, dass die Wahrscheinlichkeitsfunktion um einen festen Wert angepasst wird, der die positive Verzerrung kleiner Stichproben verringert. Die festgelegte Menge ist effektiv eine Funktion der Information, die mit zunehmender Stichprobengröße auf Null geht. Richtig?
ESmith5988

Zu Ihrer ersten Bemerkung - Die erste Korrektur entspricht in etwa dem erwarteten Wert eines Beitrags zur Wahrscheinlichkeit, der durch eine Beobachtung mit einem effektiven Gewicht von 1/2 hinzugefügt worden wäre. Dies ist keineswegs die richtige Erklärung, geschweige denn die Intuition, warum Sie dies tun möchten; es gibt dir nur den Geschmack. Sie setzen die Koeffizienten auf Null, weil Sie keine bessere Vorstellung davon haben, wie die Zahlen aussehen werden (und Nullkoeffizienten entsprechen in guter Weise keinem Effekt der Regressoren, was die meiste Zeit von Bedeutung ist). Bei deinem zweiten Kommentar - richtig.
StasK
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.