Vorhersage von wenn die Antwortvariable


7

Mein geschätztes Modell ist

ln^(yt)=9.8730.472ln(xt2)0.01xt3

Ich werde gebeten, einen prädiktiven CI mit 95% Konfidenz für den Mittelwert von y0 , wenn x02=250 und x03=8 . Wir nehmen an, dass s2x0(XTX)1x0T=0.000243952 , wobei x0=(250,8) .

Ich habe eine Lösung aus einem früheren Jahr, die so aussieht:

Ich finde das CI der Form CI(E[ln(y0)|x0])=[ln^(yt)tα/2sE,ln^(yt)+tα/2sE] , wobei t das α/2 -Oberquantil der Verteilung t(nk) und sE=0.000243952 . Dies gibt mir [7.1563,7.2175] .

Dann macht der Autor CI(E[y0|x0])=[e7.1563,e7.2175]=[1282.158,1363.077] .

Ich bin mit diesem letzten Schritt nicht einverstanden (durch Jensens Ungleichheit werden wir unterschätzen). In Wooldridges Einführung in die Ökonometrie auf Seite 212 stellt er fest, dass ein konsistenter Schätzer ist, wenn wir sicher sind, dass die Fehlerterme normal sind:

E^[y0|x0]=es2/2eln^(y0)

Also dachte ich darüber nach

CI(E[y0|x0])=[es2/21282.158,es2/21363.077]=[1282.314,1363.243]

Ist das richtig?

Die Lösung für diese Übung besagt außerdem, dass , was weit von jeder Lösung entfernt ist, die ich habe.CI(E[y0|x0])=[624.020,663.519]

Jede Hilfe wäre dankbar.

PS: Ich habe auch gelesen, dass die Korrektur nicht für das CI verwendet werden sollte, sondern nur für die PunktschätzungE^[y0|x0]

Antworten:


3

Sie finden nicht die gleiche Antwort, weil ich vermute, dass es sich um einen Tippfehler handelt, der daher der Hauptgrund für Ihr Problem wäre: würde auf und nicht auf . Eine andere Möglichkeit, wenn Sie , ist ein Fehler im zweiten geschätzten Koeffizienten, z. B. anstelle von . 80 8 x 03 = 8 β 2 = - 0,1 - 0,01x03808x03=8β^2=0.10.01

Wie auch immer, eine dieser Modifikationen löst alles und liefert das gleiche Ergebnis wie die Lösung für diese Übung.

In Anbetracht dieser Änderung erhält man mittα/2=1.96476138969835

Methode 1

CI(E[y0|x0])=[e6.43618291164626,e6.49755798189177]=[624.020307335178,663.519326788772] (die angegebene Lösung für diese Übung)

oder

Methode 2

(wie in Wooldridges Einführung in die Ökonometrie auf Seite 212 angegeben) Wenn wir sicher sind, dass die Fehlerbedingungen normal sind (und man sehr viel Glück hat)

CI(E[y0|x0])=[es2/2624.0203,es2/2663.5193]=[624.0960,663.6002]

jedoch

Es ist sehr unwahrscheinlich, dass die Methode 2 korrekt ist, da, wie Sie in Ihrer [...] Frage erwähnen, die (Unterschätzungs-) Korrektur nicht für das CI verwendet werden sollte, sondern nur für die Punktschätzung.

Warum ? Ich würde sagen, wegen der Abhängigkeit zwischen den beiden Begriffen bedeutet die Kenntnis der Erwartungen von 2/2 einerseits und andererseits nicht, dass man die von kennt .^ y 0 e s 2es2/2y0^es22+ln(y0)^


2

Punktvorhersage und CI sind unterschiedlich.

Für die Punktvorhersage sind wir besser dran, wenn wir die Verzerrung so weit wie möglich korrigieren. Für CI ist von Anfang an erforderlich, dass die Wahrscheinlichkeit beträgt . Wenn beispielsweise der 95% CI für , ist sicherlich ein 95% CI für weil . Ihr ist also sicherlich ein gültiges CI.[ a , b ] ln ( y 0 ) [ e a , e b ] y 0 P ( a ln X b ) = P ( e aX e b ) [ e 7,1563 , e 7.2175 ]100(1α)%[a,b]ln(y0)[ea,eb]y0P(alnXb)=P(eaXeb)[e7.1563,e7.2175]

Das Zentrum dieses CI ist jedoch aufgrund von Jensens Ungleichung weder der naive Prädiktor (exp [Prädiktor von ]) noch der korrigierte Prädiktor von (ein Korrekturfaktor multipliziert mit dem naiven Prädiktor), aber es spielt keine Rolle. In einigen Fällen (nicht immer) können Sie möglicherweise das CI für einige und in ändern, sodass die Wahrscheinlichkeit immer noch 95% beträgt und sein Zentrum die Verzerrung ist. korrigierter Prädiktor, aber ich sehe den Punkt darin nicht.y 0 [ e a - p , e b - q ] p qlny0y0[eap,ebq]pq

Was Sie vorgeschlagen haben, dh ist kein 95% CI. Um zu sehen, warum, sei der Korrekturfaktor (der Einfachheit halber nicht zufällig und vollkommen bekannt), so dass der vorspannungskorrigierte Prädiktor , wobei der unverzerrte Prädiktor von ( in Ihrem Beispiel). Dieses " " kann zum Beispiel durch geschätzt werden , aber während letzteres zufällig ist, wird zufällig angenommen, um es einfach zu machen. Sei der 95% CI für , dh[es2/2ea,es2/2eb]hheθθlny0β^0+β^2lnx2+β^3x3hes2/2h[a,b]lny0P(alny0b)=0.95. Dann ist was nicht gleich sei denn, die Verteilung von ist gleichmäßig, was normalerweise nicht der ist.

P(heay0heb)=P(lnh+alny0lnh+b),
P(alny0b)=0.95lny0

BEARBEITEN

Das Obige handelt von dem CI von , nicht von . Die ursprüngliche Frage betrifft das CI für . Sei , was durch geschätzt wird . In diesem Fall halte ich die Delta-Methode für eine nützliche Option (siehe Antwort von Luchonacho).y0E(y|X=x0)E(y|X=x0)E(y|X=x0)=hexp(x0β)h^exp(x0β^)

Um streng zu sein, brauchen wir die gemeinsame Verteilung von und oder genauer gesagt die asymptotische Verteilung des Vektors . Dann wird die Grenzverteilung von unter Verwendung der Delta-Methode und dann CIs für kann konstruiert werden.h^β^n[(β^β),h^h]n[h^exp(x0β^)hexp(x0β)]hexp(x0β)


Danke, dass du Chan antwortest. Übrigens ist in dieser Übung der Punktschätzer für oder gleich. Die resultierende Schätzung liegt außerhalb des CI für aber innerhalb des CI für . Sollten sie nicht beide in ihrem CI sein? y0E(y|X0)E(y|X0)y0
Ein alter Mann im Meer.

Ja, es hilft. Könnten Sie meine Frage überprüfen? Es hängt damit zusammen. Economics.stackexchange.com/questions/16891/…
Ein alter Mann im Meer.

In einem Kommentar, den ich gemacht und gelöscht habe, habe ich einen Fehler gemacht. sich natürlich von wie Alecos Papadopoulos auf Ihre Frage antwortet. Vielen Dank @Anoldmaninthesea, und entschuldigen Sie das. Ich dachte vielleicht, dass nahe genug an liegt, was Sie nicht angesprochen haben. Hmm, in diesem Fall ist Ihre Bemerkung noch interessanter. E(y|X=x0)exp{E(logy|X=x0)}exp(x0β^)exp(x0β)
Chan1142

1
Ich habe nie über dieses Problem nachgedacht. Ich werde jetzt. Es geht also um das CI für . Die von Luchonacho erläuterte Delta-Methode erscheint in diesem Fall nützlich. Vielen Dank an @Anoldmaninthesea für die Erhöhung. E(y|X=x0)
Chan1142

Chan, ich habe eine andere Frage von mir mit dieser verknüpft. Dort finden Sie eine Antwort, die ich geschrieben habe und die Sie vielleicht interessant finden.
Ein alter Mann im Meer.

1

Verwenden Sie die Delta-Methode . Angenommen, die asymptotische Verteilung eines einzelnen Parameters großen Stichproben ist:β

β^aN(β,Var(β^)n)

(vorausgesetzt, Ihre Schätzung ist konsistent)

Außerdem interessieren Sie sich für eine Funktion von , beispielsweise . Dann führt eine Taylor- Näherung erster Ordnung der obigen zu der folgenden asymptotischen Verteilung:β^F(β^)

F(β^)aN(F(β),(F(β^)β^)2Var(β^)n)

In Ihrem Fall ist . Von hier aus können Sie das CI wie gewohnt erstellen.e βF(β^)eβ^

Quelle und weitere Details im verknüpften Dokument.


lucho, ich kann die Delta-Methode dafür nicht verwenden ... aber trotzdem danke. ;)
Ein alter Mann im Meer.

: o warum nicht? Irgendeine Annahme, die ich falsch verstanden oder nicht angegeben habe?
Luchonacho

1
Es ist einfach nicht der Punkt der Übung. Ich bin wirklich daran interessiert zu wissen, welche der Methoden richtig ist. Außerdem gibt Ihre Methode eine ungefähre Verteilung an, während in der Übung ein genaues CI gewünscht wird.
Ein alter Mann im Meer.
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.