Kann jemand helfen, eine konzeptionelle Erklärung dafür zu geben, wie Vorhersagen für neue Daten getroffen werden, wenn Glättungen / Splines für ein Vorhersagemodell verwendet werden? Wie werden beispielsweise bei einem Modell, das mit gamboost
dem mboost
Paket in R mit p-Splines erstellt wurde, Vorhersagen für neue Daten getroffen? Was wird aus den Trainingsdaten verwendet?
Angenommen, es gibt einen neuen Wert für die unabhängige Variable x, und wir möchten y vorhersagen. Wird eine Formel für die Spline-Erstellung auf diesen neuen Datenwert unter Verwendung der beim Training des Modells verwendeten Knoten oder df angewendet, und dann werden die Koeffizienten aus dem trainierten Modell angewendet, um die Vorhersage auszugeben?
Hier ist ein Beispiel mit R: Was wird konzeptionell vorausgesagt, um 899.4139 für die neuen Daten mean_radius = 15.99 auszugeben?
#take the data wpbc as example
library(mboost)
data(wpbc)
modNew<-gamboost(mean_area~mean_radius, data = wpbc, baselearner = "bbs", dfbase = 4, family=Gaussian(),control = boost_control(mstop = 5))
test<-data.frame(mean_radius=15.99)
predict(modNew,test)