Warum verzerrt kein Messfehler in der abhängigen Variablen die Ergebnisse?


10

Wenn es einen Messfehler in der unabhängigen Variablen gibt, habe ich verstanden, dass die Ergebnisse gegen 0 verzerrt werden. Wenn die abhängige Variable mit einem Fehler gemessen wird, sagen sie, dass sie nur die Standardfehler beeinflusst, aber das macht für mich nicht viel Sinn, weil wir es sind Schätzen der Auswirkung von nicht auf die ursprüngliche Variable Y, sondern auf ein anderes Y plus einen Fehler. Wie wirkt sich dies nicht auf die Schätzungen aus? Kann ich in diesem Fall auch Instrumentenvariablen verwenden, um dieses Problem zu beheben?XYY

Antworten:


16

Wenn Sie ein einfaches Modell wie schätzen möchten und es anstelle des wahren Y i nur mit einem Fehler ˜ Y i = Y i + ν i beobachten, der so ist, dass es nicht korreliert mit X und ε , wenn Sie regress ~ Y i = α + β X i + ε i Ihre geschätzte β ist β

Yi=α+βXi+ϵi
YiY~i=Yi+νiXϵ
Y~i=α+βXi+ϵi
β weil die Kovarianz zwischen einer Zufallsvariablen und einer Konstanten (α) Null ist, sowie die Kovarianzen zwischenXiundϵi,νi,da wir angenommen haben, dass sie nicht korreliert sind.
β^=Cov(Y~i,Xi)Var(Xi)=Cov(Yi+νi,Xi)Var(Xi)=Cov(α+βXi+ϵi+νi,Xi)Var(Xi)=Cov(α,Xi)Var(Xi)+βCov(Xi,Xi)Var(Xi)+Cov(ϵi,Xi)Var(Xi)+Cov(νi,Xi)Var(Xi)=βVar(Xi)Var(Xi)=β
αXiϵi,νi

Y~i=Yi+νi=α+βXi+ϵi+νi


Ich habe hier eine einfache Frage: Was ist, wenn das νi, das der Messfehler in der abhängigen Variablen ist, mit der unabhängigen interessierenden Variablen korreliert? Ich würde mir vorstellen, dass es viele Möglichkeiten gibt, dass dies passieren kann, und dass die Tendenz zur sozialen Erwünschtheit ein Beispiel sein kann. Wenn die Umfrageteilnehmer bei der Beantwortung des Fragebogens (der abhängigen Variablen) eine Tendenz zur sozialen Erwünschtheit hatten und diese Erwünschtheit mit der unabhängigen Variablen zusammenhängt, sagen wir Alter oder Geschlecht (was möglicherweise mit der sozialen Erwünschtheit zusammenhängt), was passiert in Begriffe der Endogenität dann?
Kang Inkyu

3

Die Regressionsanalyse beantwortet die Frage: "Was ist der DURCHSCHNITTLICHE Y-Wert für diejenigen, die X-Werte angegeben haben?" oder äquivalent: "Wie viel wird sich voraussichtlich im Durchschnitt ändern, wenn wir X um eine Einheit ändern?" Zufällige Messfehler ändern weder die Durchschnittswerte einer Variablen noch die Durchschnittswerte für Teilmengen von Personen, sodass zufällige Fehler in der abhängigen Variablen die Regressionsschätzungen nicht beeinflussen.

Angenommen, Sie haben Höhendaten zu einer Stichprobe von Personen. Diese Höhen werden sehr genau gemessen und spiegeln genau die wahre Statur eines jeden wider. Innerhalb der Stichprobe beträgt der Durchschnitt für Männer 175 cm und der Durchschnitt für Frauen 162 cm. Wenn Sie mithilfe der Regression berechnen, wie gut das Geschlecht die Größe vorhersagt, schätzen Sie das Modell

HEIGHT=CONSTANT+βGENDER+RESIDUAL

CONSTANTβGENDERβGENDERGENDERβRESIDUAL

ββ

βGENDERβ

GENDERβ

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.