Ich betreibe ein Logistikmodell. Der tatsächliche Modelldatensatz enthält mehr als 100 Variablen, aber ich wähle einen Testdatensatz aus, in dem sich etwa 25 Variablen befinden. Davor habe ich auch einen Datensatz mit 8-9 Variablen erstellt. Mir wurde gesagt, dass AIC- und SC-Werte verwendet werden können, um das Modell zu vergleichen. Ich beobachtete, dass das Modell höhere SC-Werte aufwies, selbst wenn die Variable niedrige p-Werte aufwies (z. B. 0053). Meiner Intuition nach sollte ein Modell mit Variablen mit gutem Signifikanzniveau zu niedrigen SC- und AIC-Werten führen. Das passiert aber nicht. Kann das bitte jemand klären. Kurz gesagt, ich möchte folgende Fragen stellen:
- Hat die Anzahl der Variablen etwas mit SC AIC zu tun?
- Sollte ich mich auf p-Werte oder niedrige SC AIC-Werte konzentrieren?
- Was sind die typischen Methoden zur Reduzierung der SC AIC-Werte?