Ich verwende eine binomiale logistische Regression, um zu ermitteln, ob ein Benutzer mit der Wahrscheinlichkeit auf etwas klickt has_x
oder es has_y
beeinträchtigt. Mein Modell ist das folgende:
fit = glm(formula = has_clicked ~ has_x + has_y,
data=df,
family = binomial())
Dies ist die Ausgabe von meinem Modell:
Call:
glm(formula = has_clicked ~ has_x + has_y,
family = binomial(), data = active_domains)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.9869 -0.9719 -0.9500 1.3979 1.4233
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.504737 0.008847 -57.050 < 2e-16 ***
has_xTRUE -0.056986 0.010201 -5.586 2.32e-08 ***
has_yTRUE 0.038579 0.010202 3.781 0.000156 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 217119 on 164182 degrees of freedom
Residual deviance: 217074 on 164180 degrees of freedom
AIC: 217080
Number of Fisher Scoring iterations: 4
Da jeder Koeffizient signifikant ist, kann ich anhand dieses Modells anhand des folgenden Ansatzes feststellen, welchen Wert eine dieser Kombinationen hat:
predict(fit, data.frame(has_x = T, has_y=T), type = "response")
Ich verstehe nicht, wie ich über den Std. Berichten kann. Fehler der Vorhersage.
Muss ich einfach bedienen ? Oder muss ich den S E nach einem hier beschriebenen Ansatz konvertieren ?
Wenn ich den Standardfehler für beide Variablen verstehen möchte, wie würde ich das betrachten?
Im Gegensatz zu dieser Frage bin ich daran interessiert zu verstehen, wie hoch der Prozentsatz der oberen und unteren Fehlergrenze ist. Zum Beispiel zeigt meine Vorhersage einen Wert von 37% für True,True
kann ich berechnen, dass dies für 95 % C I ist ? (0,3% ausgewählt, um meinen Standpunkt zu veranschaulichen)