Angenommen, ich habe N Beobachtungen, möglicherweise mehrere Faktoren, und ich wiederhole jede Beobachtung zweimal (oder M Mal).
Angenommen, ich habe N Beobachtungen, möglicherweise mehrere Faktoren, und ich wiederhole jede Beobachtung zweimal (oder M Mal).
Antworten:
Konzeptionell fügen Sie keine "neuen" Informationen hinzu, sondern "kennen" diese Informationen genauer.
Dies würde daher zu denselben Regressionskoeffizienten mit kleineren Standardfehlern führen.
Beispielsweise dupliziert die Funktion expand x in Stata jede Beobachtung x- mal.
sysuse auto, clear
regress mpg weight length
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0038515 .001586 -2.43 0.018 -.0070138 -.0006891
length | -.0795935 .0553577 -1.44 0.155 -.1899736 .0307867
_cons | 47.88487 6.08787 7.87 0.000 35.746 60.02374
------------------------------------------------------------------------------
expand 5
regress mpg weight length
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0038515 .0006976 -5.52 0.000 -.0052232 -.0024797
length | -.0795935 .0243486 -3.27 0.001 -.1274738 -.0317131
_cons | 47.88487 2.677698 17.88 0.000 42.61932 53.15043
------------------------------------------------------------------------------
Wie Sie sehen, werden früher nicht signifikante Koeffizienten (Längen) im erweiterten Modell statistisch signifikant und repräsentieren die Präzision, mit der Sie wissen, was Sie wissen.
Eine gewöhnliche lineare Regression löst das Problem