Wenn ich in einer linearen Regression eine kategoriale Variable habe ... woher weiß ich, welche statistische Bedeutung die kategoriale Variable hat?
Nehmen wir an, der Faktor hat 10 Stufen ... es gibt 10 verschiedene resultierende t-Werte unter dem Dach einer Faktorvariablen ...X 1
Es scheint mir, dass die statistische Signifikanz für jede Ebene der Faktorvariablen getestet wird? Nein?
@Macro: Nach Ihrem Vorschlag habe ich das folgende Beispiel erstellt:
Aus dem folgenden Modellvergleich geht hervor, dass x3 nützlich ist und in das Modell aufgenommen werden muss.
Aber eigentlich ist das falsch ...
n=100
x1=1:n
x2=(1:n)^2
x3=rnorm(n)
ee=rnorm(n)
y=3*x1-2*x2+x3+3+ee
lm1=lm(y~x1+x2+x3)
summary(lm1)
lm2=lm(y~x1+x2)
summary(lm2)
anova(lm1, lm2)
> anova(lm1, lm2)
Analysis of Variance Table
Model 1: y ~ x1 + x2 + x3
Model 2: y ~ x1 + x2
Res.Df RSS Df Sum of Sq F Pr(>F)
1 96 82.782
2 97 146.773 -1 -63.99 74.207 1.401e-13 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
x3
dasy
s generiert , daher sollte es in das Modell aufgenommen werden, und der Wert stimmt mit dieser Schlussfolgerung überein.