Die beiden Hauptmethoden zum Verständnis eines solchen Regressionsphänomens sind algebraisch - durch Manipulieren der Normalgleichungen und -formeln für ihre Lösung - und geometrisch. Algebra ist, wie in der Frage selbst dargestellt, gut. Es gibt jedoch mehrere nützliche geometrische Formulierungen der Regression. In diesem Fall bietet die Visualisierung der -Daten im -Raum Einblicke( x , y)( x , x2, y) , die ansonsten möglicherweise schwer zu bekommen sind.
Wir zahlen den Preis für das Betrachten dreidimensionaler Objekte, was auf einem statischen Bildschirm schwierig ist. (Ich finde endlos rotierende Bilder ärgerlich und füge Ihnen daher keine davon zu, auch wenn sie hilfreich sein können.) Daher spricht diese Antwort möglicherweise nicht alle an. Aber diejenigen, die bereit sind, die dritte Dimension mit ihrer Fantasie hinzuzufügen, werden belohnt. Ich schlage vor, Ihnen dabei mit sorgfältig ausgewählten Grafiken zu helfen.
Beginnen wir mit der Visualisierung der unabhängigen Variablen. Im quadratischen Regressionsmodell
yich= β0+ β1( xich) + β2( x2ich) + Fehler ,(1)
Die beiden Terme und können zwischen den Beobachtungen variieren: Sie sind die unabhängigen Variablen . Wir können alle geordneten Paare als Punkte in einer Ebene mit Achsen darstellen, die und Es ist auch aufschlussreich, alle Punkte auf der Kurve möglicher geordneter Paare zu zeichnen( xich)( x2ich)( xich, x2ich)xx2.( t , t2) :

Visualisieren Sie die Antworten (abhängige Variable) in einer dritten Dimension, indem Sie diese Figur nach hinten kippen und die vertikale Richtung für diese Dimension verwenden. Jede Antwort wird als Punktsymbol dargestellt. Diese simulierten Daten bestehen aus einem Stapel von zehn Antworten für jede der drei Stellen, die in der ersten Figur gezeigt sind; Die möglichen Höhen jedes Stapels werden mit grauen vertikalen Linien angezeigt:( x , x2)

Die quadratische Regression passt eine Ebene an diese Punkte an.
(Woher wissen wir das? Weil für jede Auswahl von Parametern die Menge der Punkte im Raum, die Gleichung erfüllen, die Nullmenge von ist die Funktion die eine Ebene senkrecht zum Vektor definiert Dieses Bit der analytischen Geometrie kauft uns auch eine quantitative Unterstützung für das Bild: Da die in diesen Abbildungen verwendeten Parameter und und beide im Vergleich zu groß sind diese Ebene nahezu vertikal und ausgerichtet diagonal in der -Ebene.)( β0, β1, β2) ,( x , x2, y)( 1 )- β1( x ) - β2( x2) + ( 1 ) y- β0,( - β1, - β2, 1 ) .β1= - 55 / 8β2= 15 / 2 ,1 ,( x , x2)
Hier ist die Ebene der kleinsten Quadrate, die an diese Punkte angepasst ist:

Auf der Ebene, von der wir annehmen könnten, dass sie eine Gleichung der Form ich die Kurve zur Kurve "" angehoben " und zeichnete das in schwarz.y= f( x , x2) ,( t , t2)
t → ( t , t2, f( t , t2) )
Lassen Sie uns alles weiter nach hinten kippen, sodass nur die und Achse angezeigt werden und die Achse unsichtbar von Ihrem Bildschirm herunterfällt:xyx2

Sie können sehen, wie die angehobene Kurve genau die gewünschte quadratische Regression ist: Sie ist der Ort aller geordneten Paare wobei der angepasste Wert ist, wenn die unabhängige Variable auf( x , y^)y^x .
Das Konfidenzband für diese angepasste Kurve zeigt, was mit der Anpassung passieren kann, wenn die Datenpunkte zufällig variiert werden. Ohne den Standpunkt zu ändern, habe ich fünf angepasste Ebenen (und ihre angehobenen Kurven) in fünf unabhängige neue Datensätze eingezeichnet (von denen nur einer angezeigt wird):

Damit Sie dies besser sehen können, habe ich die Flugzeuge fast transparent gemacht. Offensichtlich neigen die angehobenen Kurven dazu, gegenseitige Schnittpunkte in der Nähe von undx ≤ 1,75x ≈ 3.
Schauen wir uns dasselbe an, indem wir über dem dreidimensionalen Diagramm schweben und leicht nach unten und entlang der diagonalen Achse der Ebene schauen . Damit Sie sehen können, wie sich die Ebenen ändern, habe ich auch die vertikale Dimension komprimiert.

Der vertikale goldene Zaun zeigt alle Punkte über der Kurve , sodass Sie leichter sehen können, wie er sich auf alle fünf angepassten Ebenen hebt. Konzeptionell wird das Konfidenzband durch Variieren der Daten ermittelt, wodurch sich die angepassten Ebenen ändern, wodurch sich die angehobenen Kurven ändern, von wo aus sie bei jedem Wert von eine Hüllkurve möglicher angepasster Werte verfolgen( t, t2)( x , x2) .
Jetzt glaube ich, dass eine klare geometrische Erklärung möglich ist. Da die Punkte der Form fast in ihrer Ebene ausgerichtet sind, drehen sich alle angepassten Ebenen (und wackeln ein kleines Stückchen) um eine gemeinsame Linie, die über diesen Punkten liegt. (Sei die Projektion dieser Linie bis zur -Ebene: Sie nähert sich der Kurve in der ersten Abbildung sehr genau an.) Wenn diese Ebenen variiert werden, ändert sich der Betrag, um den sich die angehobene Kurve ändert ( vertikal) an jeder gegebenen Stelle ist direkt proportional zu der Entfernung von( xich, x2ich)L.( x , x2)( x , x2)( x , x2)L .

Diese Figur kehrt zur ursprünglichen planaren Perspektive zurück, um relativ zur Kurve in der Ebene unabhängiger Variablen anzuzeigen . Die beiden Punkte auf der Kurve, die am nächsten liegen, sind rot markiert. Hier sind ungefähr die angepassten Ebenen am nächsten, da die Antworten zufällig variieren. Daher neigen die angehobenen Kurven bei den entsprechenden Werten (um und ) dazu, in der Nähe dieser Punkte am wenigsten zu variieren.L.t → ( t , t2)L.x1.72.9
Algebraisch gesehen ist das Finden dieser "Knotenpunkte" eine Frage der Lösung einer quadratischen Gleichung: Somit werden höchstens zwei von ihnen existieren. Wir können daher allgemein erwarten, dass die Konfidenzbänder einer quadratischen Anpassung an -Daten bis zu zwei Stellen haben können, an denen sie am nächsten zusammenrücken - aber nicht mehr.( x ,y)
Diese Analyse gilt konzeptionell für die Polynomregression höheren Grades sowie für die multiple Regression im Allgemeinen. Obwohl wir nicht mehr als drei Dimensionen wirklich "sehen" können, garantiert die Mathematik der linearen Regression, dass die aus zwei- und dreidimensionalen Darstellungen des hier gezeigten Typs abgeleitete Intuition in höheren Dimensionen genau bleibt.