Die Variablen und X 2 sind nicht linear unabhängig. Selbst wenn es keinen quadratischen Effekt gibt, ändert das Hinzufügen von X 2 zum Modell den geschätzten Effekt von X.XX2X2X .
Lassen Sie uns einen Blick mit einer sehr einfachen Simulation werfen.
> x <- runif(1e3)
> y <- x + rnorm(length(x))
> summary(lm(y~x))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.03486 0.06233 -0.559 0.576
x 1.05843 0.10755 9.841 <2e-16 ***
Jetzt mit einem quadratischen Term im Modell passen.
> summary(lm(y~x+I(x^2)))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.03275 0.09528 0.344 0.731
x 0.65742 0.44068 1.492 0.136
I(x^2) 0.39914 0.42537 0.938 0.348
Natürlich ist der Omnibus-Test immer noch von Bedeutung, aber ich denke, das Ergebnis, das wir suchen, ist nicht dieses. Die Lösung besteht darin, orthogonale Polynome zu verwenden.
> summary(lm(y~poly(x,2)))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.49744 0.03098 16.059 <2e-16 ***
poly(x, 2)1 9.63943 0.97954 9.841 <2e-16 ***
poly(x, 2)2 0.91916 0.97954 0.938 0.348
Beachten Sie, dass die Koeffizienten von x
im ersten Modell und von poly(x,2)1
im zweiten Modell nicht gleich sind und sogar die Abschnitte unterschiedlich sind. Dies liegt daran, dass poly
orthonormale Vektoren geliefert werden, die auch orthogonal zum Vektor sind rep(1, length(x))
. Also poly(x,2)1
nicht x
, sondern (x -mean(x))/sqrt(sum((x-mean(x))**2))
...
Ein wichtiger Punkt ist, dass die Wald-Tests in diesem letzten Modell unabhängig sind. Sie können orthogonale Polynome verwenden, um zu entscheiden, bis zu welchem Grad Sie gehen möchten, indem Sie sich den Wald-Test ansehen: Hier entscheiden Sie sich, aber nicht X 2 beizubehaltenXX2 . Natürlich würden Sie das gleiche Modell finden, wenn Sie die ersten beiden Modelle vergleichen, aber auf diese Weise ist es einfacher - wenn Sie überlegen, in höhere Grade aufzusteigen, ist es wirklich viel einfacher.
Sobald Sie entschieden haben, welche Begriffe beibehalten werden sollen, möchten Sie möglicherweise zur Interpretierbarkeit oder zur Vorhersage zu den Rohpolynomen und X 2 zurückkehren .XX2