Ich möchte eine logistische Regression mit der folgenden Binomialantwort und mit und als meinen Prädiktoren durchführen.
Ich kann die gleichen Daten wie Bernoulli-Antworten im folgenden Format präsentieren.
Die logistischen Regressionsausgaben für diese beiden Datensätze sind größtenteils gleich. Die Abweichungsreste und der AIC sind unterschiedlich. (Der Unterschied zwischen der Nullabweichung und der Restabweichung ist in beiden Fällen gleich - 0,228.)
Das Folgende sind die Regressionsausgaben von R. Die Datensätze heißen binom.data und bern.data.
Hier ist die Binomialausgabe.
Call:
glm(formula = cbind(Successes, Trials - Successes) ~ X1 + X2,
family = binomial, data = binom.data)
Deviance Residuals:
[1] 0 0 0
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.9649 21.6072 -0.137 0.891
X1Yes -0.1897 2.5290 -0.075 0.940
X2 0.3596 1.9094 0.188 0.851
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 2.2846e-01 on 2 degrees of freedom
Residual deviance: -4.9328e-32 on 0 degrees of freedom
AIC: 11.473
Number of Fisher Scoring iterations: 4
Hier ist die Bernoulli-Ausgabe.
Call:
glm(formula = Success ~ X1 + X2, family = binomial, data = bern.data)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.6651 -1.3537 0.7585 0.9281 1.0108
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.9649 21.6072 -0.137 0.891
X1Yes -0.1897 2.5290 -0.075 0.940
X2 0.3596 1.9094 0.188 0.851
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 15.276 on 11 degrees of freedom
Residual deviance: 15.048 on 9 degrees of freedom
AIC: 21.048
Number of Fisher Scoring iterations: 4
Meine Fragen:
1) Ich kann sehen, dass die Punktschätzungen und Standardfehler zwischen den beiden Ansätzen in diesem speziellen Fall äquivalent sind. Trifft diese Äquivalenz im Allgemeinen zu?
2) Wie kann die Antwort auf Frage 1 mathematisch begründet werden?
3) Warum unterscheiden sich die Abweichungsreste und der AIC?