Wie zeichnet man die Entscheidungsgrenze in R für ein logistisches Regressionsmodell?


15

Ich habe mit glm in R ein logistisches Regressionsmodell erstellt. Ich habe zwei unabhängige Variablen. Wie kann ich die Entscheidungsgrenze meines Modells im Streudiagramm der beiden Variablen darstellen? Wie kann ich beispielsweise eine Abbildung wie die folgende zeichnen: http://onlinecourses.science.psu.edu/stat557/node/55

Vielen Dank.


2
Der Link zur Figur ist tot.
Nick Stauner

Antworten:


24
set.seed(1234)

x1 <- rnorm(20, 1, 2)
x2 <- rnorm(20)

y <- sign(-1 - 2 * x1 + 4 * x2 )

y[ y == -1] <- 0

df <- cbind.data.frame( y, x1, x2)

mdl <- glm( y ~ . , data = df , family=binomial)

slope <- coef(mdl)[2]/(-coef(mdl)[3])
intercept <- coef(mdl)[1]/(-coef(mdl)[3]) 

library(lattice)
xyplot( x2 ~ x1 , data = df, groups = y,
   panel=function(...){
       panel.xyplot(...)
       panel.abline(intercept , slope)
       panel.grid(...)
       })

Alt-Text

Ich muss erwähnen, dass hier eine perfekte Trennung stattfindet, daher glmgibt die Funktion eine Warnung. Dies ist jedoch hier nicht wichtig, da der Zweck darin besteht, zu veranschaulichen, wie die lineare Grenze und die Beobachtungen entsprechend ihren Kovariaten gefärbt werden.


Ich hoffe ich bin nicht altmodisch wenn ich Gitter benutze :-)
suncoolsu 13.01.11

2
Ich hoffe auch, dass, wenn dies ein HW-Problem ist, Sie nicht einfach kopieren, einfügen.
Suncoolsu

Vielen Dank. Dies ist keine HW-Frage und die Antwort ist hilfreich, um mein Modell zu verstehen.
user2755

oh ja du bist :)
mpiktas

1
Kann mir jemand die Logik hinter dem Hang erklären und abfangen? (in Bezug auf das logistische Modell)
Fernando

22

Wollte die Frage im Kommentar an die oben akzeptierte Antwort von Fernando adressieren: Kann jemand die Logik hinter dem Abhang erklären und abfangen?

Die Hypothese für die logistische Regression lautet:

hθ=G(z)

G(z)z die Form hat:

z=θ0+θ1x1+θ2x2

Da wir zwischen 0 und 1 klassifizieren, y=1 wann hθ0,5 was angesichts der Sigmoid-Funktion wahr ist, wenn:

θ0+θ1x1+θ2x20

Das Obige ist die Entscheidungsgrenze und kann wie folgt umgeordnet werden:

x2-θ0θ2+-θ1θ2x1

Dies ist eine Gleichung in Form von y=mx+b und du kannst dann sehen warum m und b werden so berechnet, wie sie in der akzeptierten Antwort stehen


2
Gute Erklärung zur obigen Antwort!
Augustin
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.