Der Hauptunterschied zwischen Interpolation und Regression ist die Definition des Problems, das sie lösen.
Wenn Sie Datenpunkte angeben, suchen Sie beim Interpolieren nach einer Funktion mit einer vordefinierten Form, deren Werte genau den angegebenen entsprechen. Das bedeutet, dass Sie bei gegebenen Paaren ( x i , y i ) nach F einer vordefinierten Form suchen , die F ( x i ) = y i erfüllt . Ich denke, am häufigsten wird F als Polynom, Spline (Polynome niedrigen Grades in Intervallen zwischen gegebenen Punkten) gewählt.n( xich, yich)FF( xich) = yichF
Wenn Sie eine Regression durchführen, suchen Sie nach einer Funktion, die einige Kosten minimiert, normalerweise die Summe der Fehlerquadrate. Sie benötigen die Funktion nicht, um die genauen Werte an bestimmten Punkten zu haben, Sie möchten nur eine gute Annäherung. Im Allgemeinen erfüllt Ihre gefundene Funktion möglicherweise nicht F ( x i ) = y i für einen Datenpunkt, aber die Kostenfunktion, dh ∑ n i = 1 ( F ( x i ) - y i ) 2 , ist die kleinstmögliche aller Funktionen der gegebenen Form.FF( xich) = yich∑ni = 1( F( xich) - yich)2
Ein gutes Beispiel dafür, warum Sie nur approximieren statt interpolieren möchten, sind die Kurse an der Börse. Sie können Preise in einigen letzten Zeiteinheiten nehmen und versuchen, sie zu interpolieren, um eine Vorhersage des Preises in der nächsten Zeiteinheit zu erhalten. Dies ist eher eine schlechte Idee, denn es gibt keinen Grund zu der Annahme, dass die Beziehungen zwischen den Preisen durch ein Polynom genau ausgedrückt werden können. Aber eine lineare Regression könnte den Trick machen, da die Kurse eine gewisse "Steigung" aufweisen und eine lineare Funktion zumindest lokal eine gute Annäherung sein könnte (Hinweis: Es ist nicht so einfach, aber eine Regression ist definitiv eine bessere Idee als eine Interpolation in diesem Fall ).k