Ich habe eine Frage zur Gültigkeit der Verwendung von RMSE (Root Mean Squared Error) zum Vergleich verschiedener Logistikmodelle. Die Antwort ist entweder 0
oder 1
und die Vorhersagen sind Wahrscheinlichkeiten zwischen 0
- 1
?
Ist der unten angewandte Weg auch für die binären Antworten gültig?
# Using glmnet
require(glmnet)
load(url("https://github.com/cran/glmnet/raw/master /data/BinomialExample.RData"))
cvfit = cv.glmnet(x, y, family = "binomial", type.measure = "mse")
A <- predict(cvfit, newx = x, s = "lambda.min", type = "response")
RMSE1 <- mean((y - A)^2)
# 0.05816881
# glm
mydata <- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
mydata$rank <- factor(mydata$rank)
mylogit <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial")
AAA <- predict(mylogit, newdata = mydata, type = "response")
RMSE2 <- mean((mydata$admit - AAA)^2)
# 0.194714