Ich habe ein klassisches lineares Modell mit 5 möglichen Regressoren. Sie sind nicht miteinander korreliert und weisen eine relativ geringe Korrelation mit der Antwort auf. Ich bin zu einem Modell gekommen, bei dem 3 der Regressoren signifikante Koeffizienten für ihre t-Statistik haben (p <0,05). Wenn Sie eine oder beide der beiden verbleibenden Variablen addieren, erhalten Sie für die t-Statistik und die hinzugefügten Variablen p-Werte> 0,05. Dies lässt mich glauben, dass das 3-Variablen-Modell "am besten" ist.
Bei Verwendung des Befehls anova (a, b) in R, bei dem a das 3-Variablen-Modell und b das Vollmodell ist, ist der p-Wert für die F-Statistik jedoch <0,05, was bedeutet, dass ich das Vollmodell der 3-Variablen vorziehen soll Modell. Wie kann ich diese offensichtlichen Widersprüche in Einklang bringen?
Danke PS Edit: Einige weitere Hintergründe. Da dies Hausaufgaben sind, werde ich keine Details veröffentlichen, aber wir erhalten keine Details darüber, was die Regressoren repräsentieren - sie sind nur von 1 bis 5 nummeriert.