OLS: in der 1. Gleichung spannt Standardfehler in der 2. Gleichung vor?


8

Angenommen, Xit,Yit sind Zeitreihen mit XitN(0.1,1) , ( σ2(Yit)=1 und mean(Yit) ähnelt dem für Xit , ändert sich jedoch, wenn der Dummy = 1) ist. und t{1,2,...,200} , i{1,2,...,N} . In einer realen Welt sind dies periodische Börsenrenditen gegenüber N Unternehmen (aber Sie können dies ignorieren). Es gibt einen Dummy Dt , der gleich Eins über t{150,151,...,200} und ansonsten gleich Null ist. Das mit OLS \ forall i zu schätzende Zeitreihenmodell ilautet:

(1)Yit=αi+βiXit+γiDt+ϵit

Dieses Modell entspricht im Allgemeinen den Gauß-Markov-Annahmen für jedes i . Wir haben jedoch E[ϵitTϵjt]0 für alle i und j .

Der nächste Schritt besteht darin, einen Vektor von Gammas unter Verwendung der N Schätzungen von Modell (1) zu konstruieren (1). Nennen Sie diesen Vektor γ^ . Wir verwenden dies dann im Querschnittsmodell:

(2)γ^i=a+bZi+ui

Dabei ist Zi eine Querschnittsvariable, die keine Verstöße gegen OLS-Annahmen verursacht und für die Erklärung von \ hat {\ gamma} _i relevant ist γ^i.


Die Behauptung in der angewandten ökonometrischen Literatur ist, dass E[ϵitTϵjt]0 in Modell (1) zu (i) führt. Kein Problem für die OLS-Koeffizientenschätzungen in (2) , aber (ii) voreingenommene Standardfehler in (2) .

  • Kann jemand bitte Ideen posten, warum dies der Fall ist?

  • Ich verstehe nicht, was ϵitT im Ausdruck E[ϵitTϵjt]0 . Natürlich ist ϵit ein Skalar und Sie können keinen Skalar transponieren. Dies ist HIER zu sehen , wo sie diese Methodik anwenden.


1
Sie sagen, dass Sie nicht verstehen, warum Varianzschätzungen in Gleichung 2 verzerrt sind, und dann sagen Sie, dass wir Ihre Schätzung, die zufällig Gleichung 2 ist, ignorieren können ? Ich glaube, ich verstehe, was Sie meinen, und könnte eine spekulative Antwort darauf geben, aber es ist besser für Sie, Ihre Frage zu präzisieren. γ
JDav

1
In Ihrem Setup kann nicht stationär sein, da sein Mittelwert von abhängt . tYitt
mpiktas

Es gibt drei Versionen der Erwartung (eine im Titel, eine im Text und eine dritte in den Kommentaren). Alle von ihnen enthalten eine mysteriöse Transponierung, obwohl in allen Fällen nur Skalare vorhanden sind. Haben Sie etwas dagegen, Ihren Beitrag zu bearbeiten, um dies zu klären?
Kardinal

@mpiktas Richtige Beobachtung, hat nach einen anderen Mittelwert (gegeben ). Vielen Dank. t = 150 γ i0Yitt=150γi0

Es wurden einige gute Antworten geliefert - ich möchte nur hinzufügen, dass dies als Zufallskoeffizientenmodell geschätzt werden muss (auch bekannt als Mehrebenenmodell für Soziologen und Psychologen, auch bekannt als gemischtes Modell für Biostatistiker). Wenn Ökonomen dies nicht wissen und es mit einem zweistufigen Verfahren abschätzen, ist das einfach zu schade für sie (und ich warte immer noch darauf, dass Fama-Macbeth-Standardfehler absterben, was sie anscheinend einfach nicht wollen).
StasK

Antworten:


3

Um sicherzugehen, dass Sie auf die Details eingehen müssen, müssen Sie die wahre Varianz-Kovarianzmatrix mit der Matrix vergleichen, die Sie in der zweiten Phase erhalten.

Der Wahre :

Dies kann erhalten werden, indem Gleichung 2 in Gleichung 1 ersetzt wird, gepooltes OLS folgt und daraus die wahre Varianz-Kovarianzmatrix :a^,b^

Yit=αi+βiXit+aDt+bDtZi+Dtui+ϵit

Die Verwendung der Matrixnotation zum Aufteilen der Gleichung in Parameter und andere führt zu:γ

Y=Xθ+Zγ+ε

wo wir an interessiert sind , , Z ist ein zweispaltiger Vektor (eine ähnliche Struktur definiert X, aber dies ist nicht von Interesse) und wobei hat Die vollständige Struktur der Kovarianzen zwischen Unternehmen ist daher nicht diagonal ( ) wie in den GAUSS-MARKOV-Annahmen. Mit Frish-Waugh können wir ols ausdrücken als:γ = [ aV(γ^)Z = [ D tγ=[ab] V (Z=[DtDtZi][i=1,..,N;t=1,...,T]σ 2 I N T γV(ε)=Σσ2INTγ

MXγ^=(ZMXZ)1ZMXY wobeiMX=IX(XX)1X

was die folgende wahre Varianz impliziert:

H = ( Z 'V(γ^)=HΣH wobeiH=(ZMXZ)1ZMX

Der andere

Unter der Annahme nicht korrelierter Unternehmen (und Zeiträume, aber dies ist nicht das Problem) hat eine einfachere diagonale Struktur . Dies bedeutet, dass Dreiecksterme 0 sind. Unter einer noch einfacheren Spezifikation (die standardmäßig von einer ökonometrischen und statistischen Software für OLS geschätzt wird) folgt GAUSS-Markov-Annahmen, was bedeutet, dass sogar die diagonalen Terme gleich sind, also wird auf herabgestuftΣΔ Σ Σ σ 2 I.ΔΔΣΣσ2I

Dies impliziert, dass eine Nichtberücksichtigung der Korrelation zwischen Unternehmen zu als:V(γ^)

V (V(γ^)=HΔH oderV(γ^)=Hσ2IHσ2(ZMxZ)1

die, wie man sehen kann, nicht gleich der wahren sind.


Mit verschiedenen Worten .. Ich gebe im Grunde die gleiche Antwort @mpiktas gab
JDav

(1) Wirklich fantastisch. (2) Scheint, als hätten Sie ignoriert, als Sie das Modell in Matrixform ausgedrückt haben? Dies sollte jedoch nichts an dem ändern, was Sie getan haben. (3) Würden Sie wissen, warum Portfolio OLS korrekte SEs liefert? (Siehe das von mir verlinkte Papier von 1986). Kümmern Sie sich nicht um Antwort (3), wenn Sie dieses Problem nicht gerne herausfinden würden. Diui

(2) Ich habe nicht alle Definitionen angegeben, um einige für die Intuition zuzulassen und Kronecker-Produkte zu vermeiden ... auf diese Weise geht die Demo "schneller". Sie können jedoch daraus schließen, dass der neue Zufallsbegriff Wenn also Unternehmen mit korreliert wurden, führt dies dazu, dass der neue Zufallsbegriff mit seinem korreliert wird auch Unternehmensdimension. (3) hat nichts von einem Portfolio-OLS gehört, aber ich denke, es ist nur ein anderer Name für etwas, das bereits in der Standardökonometrie existiert, um mit vollständigen Var-Matrizen wie WLS oder Robust OLS usw. zu u i ε i tεit=Dtui+ϵituiεit
löschen

(3) Eine gute Schätzung impliziert eine gute Schätzung. Das Portfolio-OLS schätzt irgendwie die vollständige Struktur und nicht nur Varianzen ohne Kovarianzen: oder eine einzelne Varianz:Σ Δ σ 2ΣΣΔσ2
JDav

2
Ich denke, die Notation ist ungenau. Er verwendet Skalare, bei denen Vektoren benötigt werden, um auf die Tatsache hinzuweisen, dass die Kovarianzen zwischen Unternehmen nicht Null sind. Seine Notation impliziert also ist ein Vektor mit N Zeilen. Eine andere Interpretation ist , dass er beziehe Element . In beiden Fällen meint er dasselbe, aber da es sich nicht um ein quantitatives Journal handelt, kommt es zu Unklarheiten in der mathematischen Notation ... i j ε T . t ϵ . tϵit=[ϵit]i=1,...,Nijϵ.tTϵ.t
JDav

2

Ich stelle eine weitere Antwort mit mehr Details auf.

Im standardmäßigen linearen Regressionsmodell (in Matrixform):

Y=Xβ+ε

Die OLS-Schätzung lautet wie folgt

β^=(XTX)1XTY.

Seine Varianz ist dann

Var(β^)=(XTX)1XTVar(Y)X(XTX)1.

Die übliche Annahme für eine Regression ist die folgende

Var(Y)=σ2I,

wo die Identitätsmatrix . DannI

Var(β^)=σ2(XTX)1.

In Ihrem Fall haben Sie jetzt zwei Modelle:

Yi=Miδi+ϵi

und

Γ=Lc+u,

wo

  • YiT=(Yi1,...,YiT) ,
  • X T i = ( X i 1 , . . . , X i T ) D T = ( D 1 , . . . , D T )Mi=[1,Xi,D] , mit ,XiT=(Xi1,...,XiT)DT=(D1,...,DT)
  • δiT=(αi,βi,γi)
  • ϵiT=(ϵi1,...,ϵiT)
  • ΓT=(γ1,...,γn)
  • Z T = ( Z 1 , . . . , Z n )L=[1,Z] , mitZT=(Z1,...,Zn)
  • cT=(a,b)
  • uT=(u1,...,uN) .

Beachten Sie, dass Sie das zweite Modell für die Schätzungen von angeben, was nicht üblich ist. Daher wiederhole ich es in üblicher Form für das "wahre" .γγγ

Schreiben wir die Kovarianzmatrix für OLS-Schätzungen der Koeffizienten :c

Var(c^)=(LTL)1LTVar(Γ)L(LTL)1

Das Problem ist, dass wir nicht beobachten . Wir beobachten die Schätzungen . ist Teil des Vektors& Ggr;ΓΓ^γ^i

δ^i=δi+(MiTMi)1MiTϵi.

Angenommen, ist zufällig und unabhängig von und . Dies gilt sicherlich für sodass wir nichts verlieren, wenn wir dies für andere Elemente von .δiϵiMiγiδi

Lassen Sie uns alle übereinander stapeln :δ^i

δ^T=[δ1T,...,δNT]

und erforschen Sie die Varianz von :δ^

Var(δ^)=[Var(δ^1)cov(δ^1,δ^2)cov(δ^1,δ^N)cov(δ^n,δ^1)cov(δ^n,δ2)Var(δ^N)]

Angenommen, und . Für wirVar(ϵi)=σϵ2IEϵiϵjT=0ij

cov(δ^i,δ^j)=cov(δi,δj)+cov((MiTMi)1MiTϵi,(MjTMj)1MjTϵj)=(MiTMi)1MiTE(ϵiϵjT)Mj(MjTMj)1=0

Für diagonale Elemente haben wir

Var(δ^i)=Var(δi)+σϵ2(MiTMi)1

Kehren wir zur Varianz von . Da wir anstelle von die Varianz wie folgtc^Γ^Γ

Var(c^)=(LTL)1LTVar(Γ^)L(LTL)1,

Wir können aus extrahieren, indem wir geeignete Elemente auswählen:Var(Γ^)Var(δ^)

Var(Γ^)=Var(Γ)+diag(g1,...,gn)

Dabei ist das Element von , das dem . Jedes unterscheidet sich von da sie unterschiedlichen und denen nicht angenommen wird, dass sie gleich sind.σ 2 ϵ ( M T igiσϵ2(MiTMi)1Var(γ^i)gigjXitXjt

Wir erhalten also das überraschende Ergebnis, dass algebraisch, selbst wenn wir alle notwendigen Eigenschaften annehmen, die resultierende Kovarianzmatrix zumindest algebraisch nicht der üblichen OLS-Kovarianzmatrix entspricht, da wir dafür benötigen, dass konstant ist mal identitätsmatrix was es eindeutig nicht ist.Var(Γ^)

Alle obigen Formeln wurden unter der Annahme abgeleitet, dass konstant ist, daher sind sie von abhängig . Dies bedeutet, dass wir tatsächlich berechnet haben . Durch zusätzliche Annahmen zu könnte gezeigt werden, dass die bedingungslose Varianz in Ordnung ist.XijXijVar(Γ^|X)Xij

Die auf aufgestellte Unabhängigkeitsannahme kann auch auf Unkorrelation gelockert werden. ϵi

Es wäre auch möglich, eine Simulationsstudie zu verwenden, um zu sehen, wie sich die Kovarianzmatrix unterscheidet, wenn wir anstelle von . & Ggr;Γ^Γ


1

Ich denke, das Problem liegt in der Definition des zweiten Modells. Ich denke, das wird angenommen

γi=a+bZi+ui

mit der üblichen Annahme, dass

cov(γi,γj|Z1,...,ZN)=0,

dh dass die nicht korreliert sind, wenn wir für . Wenn Sie nun anstelle von , müssen Sie überprüfen, ob die Annahme zutrifft, dh obZ iγiZiγγ^γ

cov(γi^,γ^j|Zi)=0.

Jetzt

γ^i=γi+L(ϵit),

wobei eine lineare Funktion ist. Es ist sicher anzunehmen, dass unabhängig von , aber wenn , gilt die notwendige Annahme nicht.ϵ i t Z i E ϵ i t ϵ j t0LϵitZiEϵitϵjt0

Da die Unkorrelationsannahme für die Berechnung der üblichen OLS-Statistiken von zentraler Bedeutung ist, gibt dies den Grund an, warum die Standardfehler verzerrt sind.

Dies war eine grobe Darstellung, aber ich denke, die Idee sollte funktionieren, wenn Sie sich mit den Details der OLS-Maschinen befassen würden.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.