Angenommen, Ihr Datensatz besteht aus einer Menge für i = 1 , … , n, und Sie möchten die Abhängigkeit von y von x untersuchen .( xich, yich)i = 1 , ... , nyx
Angenommen , Sie die Werte finden a und β von α und β , dass minimieren , um die Restsumme der Quadrate
n Σ i = 1 ( y i - ( α + β x i ) ) 2 .
Dann nehmen Sie y = α + β x der vorhergesagt wird y - Wert für jeden (nicht notwendigerweise bereits beobachtet) x -Wertes. Das ist eine lineare Regression.α^β^αβ
∑i = 1n( yich- ( α + βxich) )2.
y^= α^+ β^xyx
Betrachten Sie nun die Zerlegung der Gesamtsumme der Quadrate
mitn-1Freiheitsgraden, in "erklärt" und "unerklärlichen" Teile:
n Σ i = 1 ( ( α + β x i ) - ˉ y ) 2 ⏟ erläuterte+ n Σ i = 1 ( y i - ( α + β x i ) ) 2 ⏟ unerklärt.
mit1
∑i = 1n( yich- y¯)2wo y¯= y1+ ⋯ + ynn
n - 1∑i = 1n( ( α^+ β^xich) - y¯)2erklärt + ∑ i = 1n( yich- ( α^+ β^xich) )2unerklärt.
1bzw.
Freiheitsgrade. Das Varianzanalyse, und man dann hält Dinge wie F-Statistik
F = Σ n i = 1 ( ( α + β x i ) - ˉ y ) 2 / 1n - 2DieseF-Statistik testet die Nullhypothese
β=0.
F= ∑ni = 1( ( α^+ β^xich) - y¯)2/ 1∑ni = 1( yich- ( α^+ β^xich) )2/ (n-2).
β= 0
y= α + βich
ichkk - 1n - k
Ein paar zusätzliche Punkte:
- Für einige Mathematiker kann der obige Bericht den Anschein erwecken, dass das gesamte Feld nur das ist, was oben zu sehen ist, und es kann daher rätselhaft erscheinen, dass sowohl die Regression als auch die Varianzanalyse aktive Forschungsbereiche sind. Es gibt vieles, was nicht in eine Antwort passt, die hier veröffentlicht werden kann.
- y= α + βx