Ich habe einige Fragen zum AIC und hoffe, dass Sie mir helfen können. Ich habe die Modellauswahl (vorwärts oder rückwärts) basierend auf dem AIC auf meine Daten angewendet. Und einige der ausgewählten Variablen haben am Ende einen p-Wert> 0,05. Ich weiß, dass die Leute sagen, wir sollten Modelle basierend auf dem AIC anstelle des p-Werts auswählen, also scheinen der AIC und der p-Wert zwei unterschiedliche Konzepte zu sein. Könnte mir jemand sagen, was der Unterschied ist? Was ich bis jetzt verstehe, ist das:
Für die Rückwärtsauswahl mit dem AIC haben wir 3 Variablen (var1, var2, var3) und der AIC dieses Modells ist AIC *. Wenn das Ausschließen einer dieser drei Variablen nicht zu einem AIC führen würde, der signifikant niedriger ist als der AIC * (ausgedrückt als ch-Quadrat-Verteilung mit df = 1), würden wir sagen, dass diese drei Variablen das Endergebnis sind.
Ein signifikanter p-Wert für eine Variable (z. B. var1) in einem Drei-Variablen-Modell bedeutet, dass sich die standardisierte Effektgröße dieser Variablen signifikant von 0 unterscheidet (gemäß Wald oder t-Test).
Was ist der grundlegende Unterschied zwischen diesen beiden Methoden? Wie interpretiere ich es, wenn mein bestes Modell einige Variablen mit nicht signifikanten p-Werten enthält (erhalten über den AIC)?