Mein erster Gedanke war, ein Pseudo-R2 Maß wie folgt zu berechnen :
ss.dist <- sum(scale(cars$dist, scale=FALSE)^2)
ss.resid <- sum(resid(cars.lo)^2)
1-ss.resid/ss.dist
Hier erhalten wir einen Wert von 0,6814984 ( ), ähnlich wie er von einem GAM erhalten würde :≈ cor(cars$dist, predict(cars.lo))^2
library(mgcv)
summary(gam(dist ~ speed, data=cars))
Dies scheint auch in Übereinstimmung mit dem zu sein, was die S- loess
Funktion zurückgeben würde (ich habe kein S, kann es also nicht selbst überprüfen) Multiple R-squared
. Wenn ich zum Beispiel den airquality
R-Datensatz verwende, der aussieht wie die air
Daten, die Chambers und Hastie im 'White Book' verwendet haben (das in der Online-Hilfe für referenziert wird loess
; aber das ist nicht genau derselbe Datensatz), habe ich einen von 0,8101377 unter Verwendung der obigen Formel. Das stimmt ziemlich gut mit dem überein, was Chambers und Hastie berichtet haben.R2
Ich sollte beachten, dass ich kein Papier gefunden habe, das sich speziell damit befasst (ok, das war nur ein kurzes Googeln), und William Cleveland spricht in seinem Papier nicht über ähnliche Maßnahmen .R2
Ich frage mich jedoch, ob die Freiheit, mit der Sie den Grad der Glättung (oder das Fenster span
) auswählen können, die Verwendung von basierten Maßen nicht ausschließt .R2