Die Population r-square kann unter der Annahme fester oder zufälliger Bewertungen definiert werden:
Feste Punktzahlen: Die Stichprobengröße und die besonderen Werte der Prädiktoren werden festgehalten. Somit ist der Anteil der Varianz, der im Ergebnis durch die Populationsregressionsgleichung erklärt wird, wenn die Prädiktorwerte konstant gehalten werden.
Zufällige Bewertungen: Die bestimmten Werte der Prädiktoren werden aus einer Verteilung gezogen. Somit bezieht sich auf den Anteil der Varianz, der im Ergebnis in der Population erklärt wird, wobei die Prädiktorwerte der Populationsverteilung der Prädiktoren entsprechen.
Ich habe zuvor gefragt, ob diese Unterscheidung einen großen Unterschied zu Schätzungen von . Ich habe auch allgemein gefragt, wie man eine unvoreingenommene Schätzung von berechnet .
Ich kann sehen, dass mit zunehmender Stichprobengröße die Unterscheidung zwischen fester und zufälliger Bewertung weniger wichtig wird. Ich versuche jedoch zu bestätigen, ob das angepasste zur Schätzung der festen Punktzahl oder der zufälligen Punktzahl .
Fragen
- Ist das angepasste ausgelegt, eine feste Punktzahl oder eine zufällige Punktzahl zu schätzen ?
- Gibt es eine prinzipielle Erklärung dafür, wie sich die Formel für das angepasste r-Quadrat auf die eine oder andere Form von bezieht ?
Hintergrund meiner Verwirrung
Wenn ich Yin und Fan (2001, S.206) lese, schreiben sie:
Eine der Grundannahmen des multiplen Regressionsmodells ist, dass die Werte der unabhängigen Variablen bekannte Konstanten sind und vom Forscher vor dem Experiment festgelegt werden. Nur die abhängige Variable kann von Stichprobe zu Stichprobe variieren. Dieses Regressionsmodell wird als festes lineares Regressionsmodell bezeichnet .
In den Sozial- und Verhaltenswissenschaften werden die Werte unabhängiger Variablen von den Forschern jedoch selten festgelegt und unterliegen auch zufälligen Fehlern. Daher wurde ein zweites Regressionsmodell für Anwendungen vorgeschlagen, bei dem sowohl abhängige als auch unabhängige Variablen variieren dürfen (Binder, 1959; Park & Dudycha, 1974). Dieses Modell wird als Zufallsmodell (oder Korrekturmodell) bezeichnet. Obwohl die Schätzungen der maximalen Wahrscheinlichkeit der Regressionskoeffizienten, die aus dem Zufallsmodell und dem festen Modell erhalten wurden, unter Normalitätsannahmen gleich sind, sind ihre Verteilungen sehr unterschiedlich. Das Zufallsmodell ist so komplex, dass mehr Forschung erforderlich ist, bevor es anstelle des üblicherweise verwendeten festen linearen Regressionsmodells akzeptiert werden kann. Daher wird normalerweise das feste Modell angewendet, auch wenn die Annahmen nicht vollständig erfüllt sind (Claudy, 1978). Solche Anwendungen des festen Regressionsmodells mit verletzten Annahmen würden eine "Überanpassung" verursachen, da der zufällige Fehler, der aus den nicht perfekten Stichprobendaten eingeführt wird, dazu neigt, in dem Prozess großgeschrieben zu werden. Infolgedessen neigt der auf diese Weise erhaltene Mehrfachkorrelationskoeffizient der Stichprobe dazu, die wahre Mehrfachkorrelation der Population zu überschätzen (Claudy, 1978; Cohen & Cohen, 1983; Cummings, 1982).
Ich war mir also nicht sicher, ob die obige Aussage besagt, dass angepasstes den durch das Zufallsmodell verursachten Fehler kompensiert, oder ob dies nur eine Einschränkung in dem Papier war, das die Existenz des Zufallsmodells kennzeichnet, aber dass das Papier dies tun würde Konzentrieren Sie sich auf das feste Modell.
Verweise
- Yin, P. & Fan, X. (2001). Schätzung der Schrumpfung bei multipler Regression: Ein Vergleich verschiedener Analysemethoden. The Journal of Experimental Education, 69 (2), 203-224. PDF