Bei der Beantwortung dieser Frage schlug John Christie vor, die Anpassung logistischer Regressionsmodelle durch Auswertung der Residuen zu bewerten. Ich kenne mich mit der Interpretation von Residuen in OLS aus. Sie sind im selben Maßstab wie die DV und sehr deutlich der Unterschied zwischen y und dem vom Modell vorhergesagten y. Für die logistische Regression habe ich in der Vergangenheit jedoch nur Schätzungen der Modellanpassung untersucht, z. B. AIC, weil ich nicht sicher war, was ein Residuum für eine logistische Regression bedeuten würde. Nach einem Blick in der Hilfe der R - Dateien ein wenig ich in R zu sehen , dass es fünf Arten von GLM Residuen zur Verfügung steht, c("deviance", "pearson", "working","response", "partial")
. Die Hilfedatei bezieht sich auf:
- Davison, AC und Snell, EJ (1991) Residuen und Diagnostika. In: Statistische Theorie und Modellierung. Zu Ehren von Sir David Cox, FRS , Hrsg. Hinkley, DV, Reid, N. und Snell, EJ, Chapman & Hall.
Ich habe keine Kopie davon. Gibt es eine kurze Beschreibung, wie jeder dieser Typen zu interpretieren ist? Wird im logistischen Kontext die Summe der quadratischen Residuen ein aussagekräftiges Maß für die Modellanpassung liefern, oder ist ein Informationskriterium besser geeignet?
binnedplot
Funktion im R-Paket- Arm eine sehr hilfreiche Darstellung von Residuen liefert. Es ist schön auf S.97-101 von Gelman und Hill 2007 beschrieben .