Ich habe eine Frage, von der ich denke, dass sie für viele Benutzer ziemlich einfach sein wird.
Ich verwende lineare Regressionsmodelle, um (i) die Beziehung mehrerer erklärender Variablen und meiner Antwortvariablen zu untersuchen und (ii) meine Antwortvariable unter Verwendung der erklärenden Variablen vorherzusagen.
Eine bestimmte erklärende Variable X scheint meine Antwortvariable erheblich zu beeinflussen. Um den Mehrwert dieser erklärenden Variablen X für die Vorhersagen meiner Antwortvariablen außerhalb der Stichprobe zu testen, habe ich zwei Modelle verwendet: Modell (a), das alle erklärenden Variablen verwendet, und Modell (b), das alle Variablen verwendet mit Ausnahme der Variablen X. Für beide Modelle gebe ich ausschließlich die Leistung außerhalb der Stichprobe an. Es scheint, dass beide Modelle fast gleich gut abschneiden. Mit anderen Worten, das Hinzufügen der erklärenden Variablen X verbessert die Vorhersagen außerhalb der Stichprobe nicht. Beachten Sie, dass ich auch Modell (a) verwendet habe, dh das Modell mit allen erklärenden Variablen, um festzustellen, dass die erklärende Variable X meine Antwortvariable erheblich beeinflusst.
Meine Frage ist nun: Wie ist dieser Befund zu interpretieren? Die einfache Schlussfolgerung ist, dass die Variable X, obwohl sie meine Antwortvariable unter Verwendung von Inferenzmodellen signifikant zu beeinflussen scheint, die Vorhersagen außerhalb der Stichprobe nicht verbessert. Ich habe jedoch Probleme, diesen Befund weiter zu erklären. Wie kann dies möglich sein und was sind einige Erklärungen für diesen Befund?
Danke im Voraus!
Zusätzliche Informationen: Mit 'signifikantem Einfluss' meine ich, dass 0 nicht im höchsten 95% posterioren Dichteintervall der Parameterschätzung enthalten ist (ich verwende einen Bayes'schen Ansatz). Häufig entspricht dies in etwa einem p-Wert von weniger als 0,05. Ich verwende nur diffuse (nicht informative) Prioritäten für alle meine Modellparameter. Meine Daten haben eine Längsstruktur und enthalten insgesamt rund 7000 Beobachtungen. Für die Vorhersagen außerhalb der Stichprobe habe ich 90% der Daten verwendet, um meine Modelle anzupassen, und 10% der Daten, um die Modelle mithilfe mehrerer Replikationen zu bewerten. Das heißt, ich habe den Zugtest-Split mehrmals durchgeführt und schließlich die durchschnittlichen Leistungsmetriken angegeben.