Es ist weit verbreitet anzunehmen, dass nur Daten einem Messfehler unterliegen (oder zumindest, dass dies der einzige Fehler ist, den wir berücksichtigen werden). Dies ignoriert jedoch die Möglichkeit - und die Konsequenzen - von Fehlern bei den Messungen. Dies kann in Beobachtungsstudien besonders akut sein, in denen die Variablen nicht experimentell kontrolliert werden.x xyxx
Regressionsverdünnung oder Regressionsabschwächung ist das von Spearman (1904) erkannte Phänomen, bei dem die geschätzte Regressionssteigung bei der einfachen linearen Regression durch das Vorhandensein eines Messfehlers in der unabhängigen Variablen gegen Null verschoben wird. Angenommen, die wahre Steigung ist positiv - der Effekt des Zitterns der-Koordinatender Punkte(möglicherweise am einfachsten als horizontales "Verwischen" der Punkte sichtbar) besteht darin, die Regressionslinie weniger steil zu machen. Intuitiv istes jetzt wahrscheinlicher, dassPunkte mit einem großenaufgrund eines positiven Messfehlers so sind, während derWert eher den wahren (fehlerfreien) Wert vonwiderspiegeltund daher niedriger ist als die wahre Linie für die beobachtetenx y x xxxyxx .
In komplexeren Modellen können Messfehler in Variablen kompliziertere Auswirkungen auf die Parameterschätzungen haben. Es gibt Fehler in Variablenmodellen , die solche Fehler berücksichtigen. Spearman schlug einen Korrekturfaktor zur Abschwächung der bivariaten Korrelationskoeffizienten vor, und andere Korrekturfaktoren wurden für komplexere Situationen entwickelt. Solche Korrekturen können jedoch schwierig sein - insbesondere im multivariaten Fall und bei Vorhandensein von Störfaktoren - und es kann umstritten sein, ob die Korrektur eine echte Verbesserung darstellt, siehe z. B. Smith und Phillips (1996).x
Ich nehme also an, dass dies zwei falsche Vorstellungen für den Preis von einem sind - einerseits ist es ein Fehler zu glauben, dass die Art und Weise, wie wir schreiben , "der ganze Fehler ist im " bedeutet, und genau das zu ignorieren physikalisch reale Möglichkeit von Messfehlern in den unabhängigen Variablen. Auf der anderen Seite kann es nicht ratsam sein, "Korrekturen" für Messfehler in all solchen Situationen blind anzuwenden, wie z. B. in Form einer Ruckreaktion (obwohl es durchaus eine gute Idee sein kann, Schritte zu unternehmen, um den Messfehler zu reduzieren). .yy=Xβ+εy
(Ich sollte wahrscheinlich auch einen Link zu einigen anderen gängigen Fehler-in-Variablen - Modellen, in zunehmendem Maße allgemeiner Ordnung: orthogonale Regression , Deming Regression und Total Least Squares .)
Verweise