Vergleich nicht verschachtelter Modelle mit AIC


19

Sagen wir, wir müssen GLMMs

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

Diese Modelle sind nicht im üblichen Sinne verschachtelt:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

Also können wir nicht so machen, anova(mod1, mod2)wie wir es wollten anova(a ,b).

Können wir mit AIC sagen, welches das beste Modell ist?

Antworten:


24

Der AIC kann mit nicht verschachtelten Modellen angewendet werden. In der Tat ist dies einer der am weitesten verbreiteten Mythen (Missverständnisse?) Über AIC. Sehen:

Eine Sache, bei der Sie vorsichtig sein müssen, ist das Einbeziehen aller Normalisierungskonstanten, da diese für die verschiedenen (nicht verschachtelten) Modelle unterschiedlich sind:

Siehe auch:

Im Kontext von GLMM ist die Frage heikler, wie zuverlässig der AIC für den Vergleich dieser Art von Modellen ist (siehe auch @ BenBolker's). Andere Versionen des AIC werden in der folgenden Veröffentlichung erörtert und verglichen:


2
Beachten Sie, dass die marginale und die bedingte AIC-Unterscheidung am wichtigsten sind, wenn Sie versuchen, Modelle zu vergleichen, die sich in ihren zufälligen
Effektsätzen

@Chandelier & Ben Bolker, vielen Dank für beide Antworten. Hat einer von Ihnen zufällig eine formellere Referenz für das Argument, AIC auf diese Weise zu verwenden?
user1322296

2
@ user1322296 Ich würde vorschlagen, an die Wurzel zu gehen, das ist Akaikes Papier . Der AIC wird als Schätzer für die Divergenz zwischen Ihrem Modell und dem "wahren Modell" erhalten. Also, keine Verschachtelung vorausgesetzt, nur einige Regelmäßigkeitsbedingungen.
Kronleuchter

Ist es also zum Beispiel gültig, die AIC von lm1 = x ~ A + B C und lm2 = x ~ D + B C zu vergleichen? Danke
Crazjo

Es scheint nicht verschachtelte Modelle zu geben, für die die Verwendung von AIC nicht geeignet ist. Hier sind zwei Beispiele: 1 und 2 . Würden Sie bitte einige Bedingungen angeben, unter denen die Auswahl nicht verschachtelter Modelle funktioniert?
Carl

10

Als Referenz ein Gegenargument: Brian Ripley erklärt in "Auswahl unter großen Klassen von Modellen", S. 6-7

Entscheidende Annahmen ... Die Modelle sind verschachtelt (Fußnote: siehe unten auf Seite 615 im Nachdruck von Akaike (1973)). - AIC wird häufig verwendet, wenn dies nicht der Fall ist

Die relevante Passage (auch S. 204 eines anderen Nachdrucks von Akaike) beginnt meiner Meinung nach mit dem Satz "Das Problem der statistischen Modellidentifikation wird oft als das Problem der Auswahl von f(x|kθ) ... ") ist nicht ganz vorhanden hier , ich bin für eine PDF des Papiers suchen , damit ich die Passage hier zitieren ...

Ripley, BD 2004. „Auswahl unter großen Klassen von Modellen“. In Methods and Models in Statistics , herausgegeben von N. Adams, M. Crowder, D. J. Hand und D. Stephens, 155–70. London, England: Imperial College Press.

Akaike, H. (1973) Informationstheorie und eine Erweiterung des Maximum-Likelihood-Prinzips. Im zweiten internationalen Symposium zur Informationstheorie (Hrsg. BN Petrov und F. Cáski), S. 267–281, Budapest. Akademiai Kaidó. Neuauflage in Breakthroughs in Statistics , Hrsg. Kotz, S. & Johnson, NL (1992), Band I, S. 599–624. New York: Springer.


3

Anscheinend hielt Akaike AIC für ein nützliches Tool zum Vergleichen von nicht verschachtelten Modellen.

Eine wichtige Beobachtung über AIC ist, dass es ohne spezifischen Bezug auf das wahre Modell [f (x | kθ)] definiert ist. Daher können wir für jede endliche Anzahl von parametrischen Modellen immer ein erweitertes Modell in Betracht ziehen, das die Rolle von spielen wird [f (x | kθ)] Dies legt nahe, dass AIC zumindest prinzipiell für den Vergleich von Modellen nützlich sein kann, die nicht verschachtelt sind, dh für die Situation, in der der herkömmliche Log Likelihood-Ratio-Test nicht anwendbar ist. "

(Akaike 1985, S. 399)

Akaike, Hirotugu. "Vorhersage und Entropie." Ausgewählte Arbeiten von Hirotugu Akaike. Springer, New York, NY, 1985. 387-410.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.