Gewöhnliche kleinste Quadrate (OLS)
Ordinary Least Squares (OLS) ist das Arbeitstier der Statistik. Es bietet eine Möglichkeit, komplizierte Ergebnisse zu erfassen und Verhalten (z. B. Trends) mithilfe von Linearität zu erklären. Die einfachste Anwendung von OLS ist das Anpassen einer Linie.
Rückstände
Residuen sind die beobachtbaren Fehler aus den geschätzten Koeffizienten. In gewissem Sinne sind die Residuen Schätzungen der Fehler.
Lassen Sie uns die Dinge mit R
Code erklären :
Passen Sie zuerst eine gewöhnliche kleinste quadratische Linie von Diamantdatensätzen in die UsingR
Bibliothek an:
library(UsingR)
data("diamond")
y <- diamond$price
x <- diamond$carat
n <- length(y)
olsline <- lm(y ~ x)
plot(x, y,
main ="Odinary Least square line",
xlab = "Mass (carats)",
ylab = "Price (SIN $)",
bg = "lightblue",
col = "black", cex = 2, pch = 21,frame = FALSE)
abline(olsline, lwd = 2)
Berechnen wir nun den Rest, dh die Restsumme der Quadrate: In können R
Sie den Rest einfach berechnen, da resid(olsline)
wir ihn zur Visualisierung manuell berechnen:
# The residuals from R method
e <- resid(olsline)
## Obtain the residuals manually, get the predicated Ys first
yhat <- predict(olsline)
# The residuals are y -yhat, Let's check by comparing this with R's build in resid function
ce <- y - yhat
max(abs(e-ce))
## Let's do it again hard coding the calculation of Yhat
max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x)))
# Residuals arethe signed length of the red lines
plot(diamond$carat, diamond$price,
main ="Residuals sum of (actual Y - predicted Y)^2",
xlab = "Mass (carats)",
ylab = "Price (SIN $)",
bg = "lightblue",
col = "black", cex = 2, pch = 21,frame = FALSE)
abline(olsline, lwd = 2)
for (i in 1 : n)
lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2)
Hoffe, diese Visualisierung wird Ihre Zweifel zwischen RSS & OLS klären