Anhand eines einfachen Beispiels können wir herausfinden, worauf es ankommt.
Sei
Y.= C+ γX1+ ε
wobei und & ggr; Parameter sind, X 1 die Punktzahl auf dem ersten Instrument (oder der unabhängigen Variablen) ist und & egr ; einen unverzerrten iid-Fehler darstellt. Lassen Sie die Partitur auf dem zweiten Instrument mit dem ersten über in Beziehung stehenCγX1ε
X1=αX2+β.
Beispielsweise können die Bewertungen für das zweite Instrument zwischen 25 und 75 und für das erste zwischen 0 und 100 liegen, wobei . Die Varianz von X 1 ist α 2 mal die Varianz von X 2 . Trotzdem können wir umschreibenX1=2X2−50X1α2X2
Y=C+γ(αX2+β)=(C+βγ)+(γα)X2+ε=C′+γ′X2+ε.
Die Parameter ändern sich und die Varianz der unabhängigen Variablen ändert sich , die Vorhersagefähigkeit des Modells bleibt jedoch unverändert .
Im Allgemeinen kann die Beziehung zwischen und X 2 nichtlinear sein. Welcher ist ein besserer Prädiktor für Y , hängt davon ab, welche eine engere lineare Beziehung zu Y hat . Daher handelt es sich nicht um eine Frage der Skalierung (was sich in der Varianz des X i widerspiegelt ), sondern muss durch die Beziehungen zwischen den Instrumenten und dem, was sie zur Vorhersage verwenden, entschieden werden. Diese Idee steht in engem Zusammenhang mit einer aktuellen Frage zur Auswahl unabhängiger Variablen in der Regression .X1X2YYXi
Es kann mildernde Faktoren geben. Zum Beispiel, wenn und X 2 diskrete Variablen sind und beide gleich gut mit Y verwandt sind , dann könnte diejenige mit größerer Varianz (wenn sie ausreichend gleichmäßig verteilt ist) feinere Unterscheidungen zwischen ihren Werten zulassen und dadurch mehr Präzision liefern. Eg , wenn beide Instrumente Fragebögen auf einer Skala 1-5 Likert sind, sind beide gleich gut mit korrelierten Y , und die Antworten auf X 1 sind alle 2 und 3 und die Antworten auf X 2 Ausbreitung unter 1 bis 5 sind, könnte sein , auf dieser Basis favorisiert.X1X2YYX1X2X2