Lineares Regressionsmodell, das am besten für fehlerhafte Daten geeignet ist


9

Ich suche nach einem linearen Regressionsalgorithmus, der am besten für Daten geeignet ist, deren unabhängige Variable (x) einen konstanten Messfehler aufweist und deren abhängige Variable (y) einen signalabhängigen Fehler aufweist.

Geben Sie hier die Bildbeschreibung ein

Das obige Bild zeigt meine Frage.


1
Wenn die konstante Variable x einen konstanten Messfehler aufweist und die Fehler nur dazu verwendet werden, die Variablen relativ zu gewichten, ist diese Situation nicht gleichbedeutend damit, dass keine Fehler in x vorliegen?
pedrofigueira

2
@pedro Das ist nicht der Fall, weil die Fehler in nicht nur Gewichte in einer Formel sind. Bei der Regression von Fehlern in Variablen unterscheiden sich die Anpassungen und die Kovarianzschätzungen der Parameter von der normalen Regression. x
whuber

1
Danke für die Abklärung. Könnten Sie etwas näher darauf eingehen, warum dies der Fall ist?
Pedrofigueira

Antworten:


2

Messfehler in der abhängigen Variablen

Bei einem allgemeinen linearen Modell mit ε homosckedastisch, nicht autokorreliert und unkorreliert mit den unabhängigen Variablen, sei y die "wahre" Variable und y ihre beobachtbare messen. Der Messfehler ist definiert als ihre Differenz e = y - y Das schätzbare Modell lautet also: y = β 0 + β 1 x

(1)y=β0+β1x1++βkxk+ε
εyy
e=yy
Day,x1,,xkbeobachtet werden, können wir das Modell durch OLS abschätzen. Wenn der Messfehler inystatistisch unabhängig von jeder erklärenden Variablen ist, hat(e+ε)die gleichen Eigenschaften wieεund die üblichen OLS-Inferenzverfahren (t-Statistiken usw.) sind gültig. In Ihrem Fall würde ich jedoch eine zunehmende Varianz voneerwarten. Du könntest benutzen:
(2)y=β0+β1x1++βkxk+e+ε
y,x1,,xky(e+ε)εte
  • ein gewichteter Schätzer der kleinsten Quadrate (z . B. Kutner et al. , §11.1; Verbeek , §4.3.1-3);

  • der OLS-Schätzer, der immer noch unvoreingenommen und konsistent ist, und heteroskedastizitätskonsistente Standardfehler oder einfach Wite-Standardfehler ( Verbeek , §4.3.4).

Messfehler in der unabhängigen Variablen

xkxk

ek=xkxk
  • Cov(xk,ek)=0xkxk=xkek

    y=β0+β1x1++βkxk+(εβkek)
    εexjxk
  • Cov(xk,ηk)=0xkyx1,,xk

Soweit ich anhand Ihres Diagramms erraten kann (Fehler, die sich auf die "wahren" Werte der unabhängigen Variablen konzentrieren), könnte das erste Szenario zutreffen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.