Dieser Beitrag bezieht sich auf ein bivariates lineares Regressionsmodell, . Ich habe immer die Aufteilung der Gesamtsumme der Quadrate (SSTO) in die Summe der Quadrate für Fehler (SSE) und die Summe der Quadrate für das Modell (SSR) auf Glauben genommen, aber als ich anfing, wirklich darüber nachzudenken, verstehe ich nicht warum es funktioniert ...
Der Teil I do verstehen:
: Ein beobachteter Wert von y
yi : Der Mittelwert aller beobachteten s
: Der angepasste / vorhergesagte Wert von y für das x einer gegebenen Beobachtung
: Rest / Fehler (wenn quadriert und für alle Beobachtungen addiert, ist dies SSE)
: Wie stark sich der Modellanpassungswert vom Mittelwert unterscheidet (wenn er für alle Beobachtungen quadriert und addiert wird, ist dies SSR).
: Wie stark sich ein beobachteter Wert vom Mittelwert unterscheidet (wenn er für alle Beobachtungen addiert und addiert wird, ist dies SSTO).
Ich kann verstehen, warum für eine einzelne Beobachtung, ohne etwas zu quadrieren, . Und ich kann verstehen, warum, wenn Sie Dinge über alle Beobachtungen addieren möchten, Sie sie quadrieren müssen, oder sie addieren sich zu 0.
Der Teil, den ich nicht verstehe, ist warum (zB SSTO = SSR + SSE). Es scheint, dass wenn Sie eine Situation haben, in der , dann , nicht . Warum ist das hier nicht der Fall? A = B + C A 2 = B 2 + 2 B C + C 2 A 2 = B 2 + C 2