Ich habe kein bestimmtes Beispiel oder keine bestimmte Aufgabe im Sinn. Ich bin gerade neu in der Verwendung von B-Splines und wollte diese Funktion im Regressionskontext besser verstehen.
Nehmen wir an, wir wollen die Beziehung zwischen der Antwortvariablen und einigen Prädiktoren . Die Prädiktoren enthalten einige numerische Variablen sowie einige kategoriale.
Angenommen, nach dem Anpassen eines Regressionsmodells ist eine der numerischen Variablen, z . B. signifikant. Ein logischer Schritt danach besteht darin, zu beurteilen, ob Polynome höherer Ordnung, z. B.: und erforderlich sind, um die Beziehung ohne Überanpassung angemessen zu erklären.
Meine Fragen sind:
Ab wann wählen Sie zwischen B-Splines oder einfachen Polynomen höherer Ordnung. zB in R:
y ~ poly(x1,3) + x2 + x3
vs.
y ~ bs(x1,3) + x2 + x3
Wie können Sie Diagramme verwenden, um Ihre Wahl zwischen diesen beiden zu treffen, und was passiert, wenn dies aus den Diagrammen nicht wirklich hervorgeht (z. B. aufgrund großer Datenmengen)?
Wie würden Sie die wechselseitigen Interaktionsterme zwischen und bewerten
Wie ändert sich das oben Gesagte für verschiedene Modelltypen?
Würden Sie in Betracht ziehen, niemals Polynome höherer Ordnung zu verwenden und immer B-Splines anzupassen und die hohe Flexibilität zu bestrafen?
mgcv
Warum nicht (verallgemeinerte) additive Modelle verwenden, wenn man bedenkt, wie gut entwickelt ist? Die Auswahl der Glätte erfolgt automatisch, und die Inferenzmethoden sind gut entwickelt.