Die Terminologie von Splines kann verwirrend sein (zumindest finde ich das so), da genau das, was Menschen meinen, wenn sie beispielsweise "kubischen Spline" verwenden, von der Art des kubischen Splines abhängt. Wir können zum Beispiel sowohl kubische Glättungssplines als auch kubische (bestrafte) Regressionssplines haben.
Was ich unten skizziere, stammt aus den Abschnitten 5.1.2 und 5.2 von Wood (2017).
Ein interpolierender Spline würde beispielsweise g ( x i ) = y i setzen, wenn er die Beobachtungen y i über eine Funktion interpoliert, die aus Abschnitten kubischer Polynome besteht, die so verbunden sind, dass der Spline zur zweiten Ableitung stetig ist.G( xich)G( xich) = yichyich
Ein kubischer Glättungs-Spline zielt darauf ab, die Anpassung an die Daten auszugleichen und eine glatte Funktion zu erzeugen. Ziel ist es nicht, die Daten zu interpolieren, die beim Interpolieren von Splines entstehen. Anstatt , fungiert ein kubischer Glättungsspline als n freie Parameter, die geschätzt werden müssen, um sie zu minimieren (Wood, 2017).G( xich) = yichn
∑i = 1n{ yich- g( xich) }2+ λ ∫G' '( x )2dx
Dabei ist der erste Teil ein Maß für die Anpassung an die Daten, während der zweite Teil eine Strafe gegen die Wackeligkeit darstellt (das Integral summiert die quadratische zweite Ableitung des Splines als Maß für die Krümmung oder Wackeligkeit, wie schnell die Kurve ist wechselnde Steigung). Wir können uns Wackeligkeit als Komplexität vorstellen, daher beinhaltet die Funktion eine Strafe gegen übermäßig komplexe Glättungen.
Es kann gezeigt werden, dass ein kubischer Glättungsspline aller möglichen Funktionen f die Funktionen ist, die das obige Kriterium minimieren (ein Beweis wird in Wood, 2017, Abschnitt 5.1.2, S. 198 gegeben).G( x )f
xichyichnλn
Dies ist das Hauptnegativ bei der Glättung von Splines. Sie müssen so viele Parameter schätzen, wie Sie Daten haben, und dennoch ist die Auswirkung vieler dieser Parameter im Allgemeinen gering, da zu komplexe (wackelige) Anpassungen erforderlich sind.
Dies auszugleichen ist die Tatsache, dass die Wahl der Knoten im Glättungsspline berücksichtigt wird, da es keine Wahl gibt.
Wenn wir zur Einstellung für den bestraften Regressions-Spline übergehen, haben wir nun die Wahl, wo die Knoten platziert werden sollen, aber wir können wählen, wie viele Knoten verwendet werden sollen. Wie können wir entscheiden, ob dies ein nützlicher Kompromiss ist, dass es vorteilhaft ist, den Spline mit einer reduzierten Anzahl von Knoten zu versehen, selbst wenn wir entscheiden müssen, wie viele und wo sie platziert werden sollen?
xichknλn um nahezu die optimale Leistung zu erzielen, die durch das Glätten von Splines dargestellt wird (zusammengefasst aus Wood 2017).
k - 1xxxxx
x1 i, x2 ix1x2
Verweise
Wood, SN 2016. P-Splines mit auf Derivaten basierenden Strafen und Tensorproduktglättung ungleichmäßig verteilter Daten. Stat. Comput. 1–5. doi: 10.1007 / s11222-016-9666-x ( Open Access )
Wood, SN 2017. Verallgemeinerte additive Modelle: Eine Einführung mit R, Second Edition, CRC Press.