Um die modellgemittelten Vorhersagen auf der Antwortskala eines GLM zu berechnen, welche ist "korrekt" und warum?
- Berechnen Sie die modellgemittelte Vorhersage auf der Verbindungsskala und transformieren Sie sie anschließend auf die Antwortskala zurück
- Transformieren Sie die Vorhersagen in die Antwortskala und berechnen Sie dann den Modelldurchschnitt
Die Vorhersagen sind nahe beieinander, aber nicht gleich, wenn das Modell ein GLM ist. Die verschiedenen R-Pakete bieten Optionen für beide (mit unterschiedlichen Standardeinstellungen). Mehrere Kollegen haben lautstark argumentiert, dass # 1 falsch ist, weil "jeder # 2 macht". Meine Intuition sagt, dass # 1 "korrekt" ist, da es alle linearen mathematischen Werte linear hält (# 2 mittelt Dinge, die sich nicht auf einer linearen Skala befinden). Eine einfache Simulation zeigt, dass # 2 eine sehr (sehr!) Geringfügig kleinere MSE als # 1 hat. Wenn # 2 korrekt ist, warum? Und wenn # 2 richtig ist, warum ist meine Argumentation (lineare Mathematik linear halten) schlecht?
Edit 1: Das Berechnen von Grenzmitteln über die Ebenen eines anderen Faktors in einem GLM ist ein ähnliches Problem wie die Frage, die ich oben stelle. Russell Lenth berechnet marginale Mittelwerte von GLM-Modellen unter Verwendung des "Timings" (seiner Wörter) von # 1 (im Emmeans-Paket), und sein Argument ähnelt meiner Intuition.
Bearbeiten 2: Ich verwende die Modellmittelung, um auf die Alternative zur Modellauswahl zu verweisen, bei der eine Vorhersage (oder ein Koeffizient) als gewichteter Durchschnitt über alle oder eine Teilmenge der "besten" verschachtelten Modelle geschätzt wird (siehe Referenzen und R-Pakete unten). .
Bei verschachtelten Modellen, wobei die lineare Vorhersage (im Verknüpfungsraum) für das individuelle für das Modell ist und die Gewichtung für das Modell , die modellgemittelte Vorhersage unter Verwendung von # 1 oben (Durchschnitt auf der Verknüpfung) skalieren und dann auf die Antwortskala zurücktransformieren) ist:
und die modellgemittelte Vorhersage unter Verwendung von # 2 oben (alle Vorhersagen rücktransformieren und dann auf der Antwortskala mitteln) ist:
Einige Bayesian und Frequentist Methoden der Modellmittelung sind:
Hoeting, JA, Madigan, D., Raftery, AE und Volinsky, CT, 1999. Bayesianische Modellmittelung: Ein Tutorial. Statistical Science, S. 382-401.
Burnham, KP und Anderson, DR, 2003. Modellauswahl und Multimodell-Inferenz: ein praktischer informationstheoretischer Ansatz. Springer Science & Business Media.
Hansen, BE, 2007. Modellmittelung der kleinsten Quadrate. Econometrica, 75 (4), S. 1175–1189.
Claeskens, G. und Hjort, NL, 2008. Modellauswahl und Modellmittelung. Cambridge Bücher.
R-Pakete umfassen BMA , MuMIn , BAS und AICcmodavg . (Hinweis: Dies ist keine Frage der Weisheit der Modellmittelung im Allgemeinen.)