Die Teststatistik für den Hosmer-Lemeshow- Test (HLT) für die Anpassungsgüte (GOF) eines logistischen Regressionsmodells ist wie folgt definiert:
Die Stichprobe wird dann in Dezile, , aufgeteilt. Pro Dezil werden die folgenden Größen berechnet:
- D d , dh die beobachtete Anzahl positiver Fälle im Dezil ;
- , dh die beobachtete Anzahl negativer Fälle im Dezil ;
- , dh die geschätzte Anzahl positiver Fälle im Dezil ;
- , dh die geschätzte Anzahl negativer Fälle im Dezil ;
Dabei ist das beobachtete binäre Ergebnis für die te Beobachtung und die geschätzte Wahrscheinlichkeit für diese Beobachtung. i π i
Dann ist die Teststatistik definiert als:
Dabei ist die durchschnittliche geschätzte Wahrscheinlichkeit in Dezil und die Anzahl der Unternehmen im Dezil.
Nach Hosmer-Lemeshow (siehe diesen Link ) hat diese Statistik (unter bestimmten Voraussetzungen) eine Verteilung mit Freiheitsgraden .
Wenn ich dagegen eine Kontingenztabelle mit Zeilen (entsprechend den Dezilen) und 2 Spalten (entsprechend dem binären Ergebnis true / false) definieren würde, dann die Teststatistik für den Test für diese Kontingenztabelle Wäre das gleiche wie das oben definierte , so ist diese Teststatistik im Fall der Kontingenztabelle jedoch mit Freiheitsgrade . Also ein Freiheitsgrad mehr !
Wie kann man diesen Unterschied in der Anzahl der Freiheitsgrade erklären?
BEARBEITEN: Ergänzungen nach dem Lesen von Kommentaren:
@whuber
Sie sagen (siehe Hosmer DW, Lemeshow S. (1980), Ein Anpassungstest für das multiple logistische Regressionsmodell. Communications in Statistics, A10, 1043-1069 ), dass es einen Satz gibt, den Moore und Spruill aufzeigen Daraus folgt, dass wenn (1) die Parameter unter Verwendung von Wahrscheinlichkeitsfunktionen für nicht gruppierte Daten geschätzt werden und (2) die Häufigkeiten in der 2xg-Tabelle von den geschätzten Parametern abhängen, nämlich die Zellen zufällig und nicht fest sind, dass dann unter geeigneten Regularitätsbedingungen die Die Anpassungsgütestatistik unter (1) und (2) ist die eines zentralen Chi-Quadrats mit der üblichen Verringerung der Freiheitsgrade aufgrund geschätzter Parameter plus einer Summe gewichteter Chi-Quadrat-Variablen.
Wenn ich dann ihre Arbeit gut verstehe, versuchen sie, eine Annäherung für diesen 'Korrekturbegriff' zu finden, der, wenn ich es gut verstehe, diese gewichtete Summe von Chi-Quadrat-Zufallsvariablen ist, und dies tun sie, indem sie Simulationen durchführen, aber ich muss zugeben, dass ich nicht ganz verstehe, was sie dort sagen, daher meine Frage; Warum sind diese Zellen zufällig, wie beeinflusst das die Freiheitsgrade? Wäre es anders, wenn ich die Grenzen der Zellen festlege und dann die Beobachtungen in festen Zellen basierend auf der geschätzten Punktzahl klassifiziere. In diesem Fall sind die Zellen nicht zufällig, obwohl der 'Inhalt' der Zelle ist?
@Frank Harell: Könnte es nicht sein, dass die 'Mängel' des Hosmer-Lemeshow-Tests, die Sie in Ihren Kommentaren unten erwähnen, nur eine Folge der Annäherung der gewichteten Summe der Chi-Quadrate sind ?
rms
Paket residuals.lrm
und die val.prob
Funktionen.