Ich habe angefangen, ein bisschen in die Funktion plot.lm zu graben . Diese Funktion gibt sechs Diagramme für lm an. Sie sind:
- eine Darstellung der Residuen gegen angepasste Werte
- ein Scale-Location-Diagramm von sqrt (| Residuen |) gegen angepasste Werte
- Ein normales QQ-Diagramm, ein Diagramm der Abstände von Cook gegenüber den Zeilenbeschriftungen
- eine Darstellung der Residuen gegen Hebel
- eine Darstellung der Abstände von Cook gegen die Hebelwirkung / (1 Hebelwirkung)
Und ich frage mich, welche anderen gängigen / nützlichen Erweiterungen aktueller Diagramme für lineare Modelle existieren und wie sie in R durchgeführt werden können. (Links zu Paketartikeln sind ebenfalls willkommen)
Die Boxcox-Funktion (von {MASS}) ist also ein Beispiel für ein anderes nützliches Diagnose-Diagramm (und eine solche Antwort wäre großartig). Ich bin jedoch neugieriger auf Variationen / Erweiterungen bestehender Standard-Diagnose-Diagramme für lm in R (obwohl allgemein) andere Bemerkungen zum Thema sind immer willkommen).
Hier sind einige einfache Beispiele dafür, was ich meine:
#Some example code for all of us to refer to
set.seed(2542)
x1 <- rnorm(100)
x2 <- runif(100, -2,2)
eps <- rnorm(100,0,2)
y <- 1 + 2*x1 + 3*x2 + eps
y[1:4] <- 14 # adding some contaminated points
fit <- lm(y~x1+x2)
#plot(y~x1+x2)
#summary(fit)
Darstellung der Residuen gegen jedes der Potentiale x
plot(resid(fit)~x1); abline (h = 0)
plot(resid(fit)~x2); abline (h = 0)
# plot(resid(fit)~x1+x2) # you can also use this, but then you wouldn't be able to use the abline on any plot but the last one
Hinzufügen der 0-1-Zeile (wie heißt diese Zeile auf Englisch?!) Zum qqplot, um zu sehen, wie stark die qqline davon abweicht
plot(fit, which = 2); abline(0,1, col = "green")
Plotten des qq-Plots mit extern studentisierten Residuen
# plot(fit, which = 2); abline(0,1, col = "green") # The next command is just like this one
qqnorm(rstandard(fit), ylim = c(-2.2,4.2)); qqline(rstudent(fit), lty = 2) ;abline(0,1, col = "green")
qqnorm(rstudent(fit), ylim = c(-2.2,4.2)); qqline(rstudent(fit), lty = 2) ;abline(0,1, col = "green")
# We can note how the "bad" points are more extreme when using the rstudent