Zeitverzerrungsschätzer der logarithmischen Normalverteilung


25

Ich mache ein numerisches Experiment, das darin besteht, eine logarithmische Normalverteilung und die Momente mit zwei Methoden zu schätzen :XLN(μ,σ)E[Xn]

  1. Betrachtet man den Stichprobenmittelwert von Xn
  2. Schätzen von μ und σ2 unter Verwendung der Beispielmittel für Log(X),Log2(X) und dann unter Verwendung der Tatsache, dass für eine lognormale Verteilung E[Xn]=exp(nμ+(nσ)2/2) .

Die Frage ist :

Ich finde experimentell, dass die zweite Methode viel besser funktioniert als die erste, wenn ich die Anzahl der Samples festhalte und μ,σ2 um einen Faktor T erhöhe . Gibt es eine einfache Erklärung für diese Tatsache?

Ich füge eine Abbildung bei, in der die x-Achse T ist, während die y-Achse die Werte von E[X2] , die die wahren Werte von E[X2]=exp(2μ+2σ2) (orange Linie) zu den geschätzten Werten. Methode 1 - blaue Punkte, Methode 2 - grüne Punkte. Die y-Achse ist in der logarithmischen Skala

Wahre und geschätzte Werte für $ \ mathbb {E} [X ^ 2] $.  Blaue Punkte sind Stichprobenmittelwerte für $ \ mathbb {E} [X ^ 2] $ (Methode 1), während die grünen Punkte die Schätzwerte nach Methode 2 sind. Die orange Linie wird aus den bekannten $ \ mu $, $ \ berechnet. Sigma $ nach der gleichen Gleichung wie in Methode 2. Die y-Achse ist in logarithmischem Maßstab

BEARBEITEN:

Unten finden Sie einen minimalen Mathematica-Code, um die Ergebnisse für ein T mit der Ausgabe zu erzeugen:

   ClearAll[n,numIterations,sigma,mu,totalTime,data,rmomentFromMuSigma,rmomentSample,rmomentSample]
(* Define variables *)
n=2; numIterations = 10^4; sigma = 0.5; mu=0.1; totalTime = 200;
(* Create log normal data*)
data=RandomVariate[LogNormalDistribution[mu*totalTime,sigma*Sqrt[totalTime]],numIterations];

(* the moment by theory:*)
rmomentTheory = Exp[(n*mu+(n*sigma)^2/2)*totalTime];

(*Calculate directly: *)
rmomentSample = Mean[data^n];

(*Calculate through estimated mu and sigma *)
muNumerical = Mean[Log[data]]; (*numerical \[Mu] (gaussian mean) *)
sigmaSqrNumerical = Mean[Log[data]^2]-(muNumerical)^2; (* numerical gaussian variance *)
rmomentFromMuSigma = Exp[ muNumerical*n + (n ^2sigmaSqrNumerical)/2];

(*output*)
Log@{rmomentTheory, rmomentSample,rmomentFromMuSigma}

Ausgabe:

(*Log of {analytic, sample mean of r^2, using mu and sigma} *)
{140., 91.8953, 137.519}

oben ist das zweite Ergebnis der Stichprobenmittelwert von r2 , der unter den beiden anderen Ergebnissen liegt


2
Ein unbefangener Schätzer impliziert nicht , dass die blauen Punkte in der Nähe des erwarteten Wertes liegen sollten (orange Kurve). Ein Schätzer kann unvoreingenommen sein, wenn er eine hohe Wahrscheinlichkeit hat, zu niedrig zu sein, und eine geringe (möglicherweise verschwindend geringe) Wahrscheinlichkeit, viel zu hoch zu sein. Das passiert, wenn T zunimmt und die Varianz riesengroß wird (siehe meine Antwort).
Matthew Gunn

Informationen dazu , wie Sie unvoreingenommene Schätzer erhalten, finden Sie unter stats.stackexchange.com/questions/105717 . UMVUEs des Mittelwerts und der Varianz sind in den Antworten und Kommentaren dazu angegeben.
Whuber

Antworten:


22

In diesen Ergebnissen liegt seitdem etwas Rätselhaftes

  1. Die erste Methode liefert einen unverzerrten Schätzer für , nämlich 1E[X2] hatE[X2]als Mittelwert. Daher sollten die blauen Punkte um den erwarteten Wert liegen (orange Kurve).
    1Ni=1NXi2
    E[X2]
  2. Das zweite Verfahren stellt einen vorgespannten Schätzer von , nämlich E [ exp ( n μ + n 2 σ 2 / 2 ) ] > exp ( n μ + ( n σ ) 2 / 2 ) , wenn μ und σ ² sind unvoreingenommene Schätzer von μ und σ ²E[X2]
    E[exp(nμ^+n2σ^2/2)]>exp(nμ+(nσ)2/2)
    μ^σ^²μσ² und es ist daher merkwürdig, dass die grünen Punkte mit der orangefarbenen Kurve ausgerichtet sind.

aber sie sind auf das Problem und nicht auf die numerischen Berechnungen zurückzuführen: Ich wiederholte das Experiment in R und erhielt das folgende Bild mit dem gleichen Farbcode und der gleichen Folge von und σ T , die jeden geteilten Schätzer darstellen von der wahren Erwartung:μTσT

Zwei empirische zweite Momente, basierend auf 10⁶ log-normalen Simulationen

Hier ist der entsprechende R-Code:

moy1=moy2=rep(0,200)
mus=0.14*(1:200)
sigs=sqrt(0.13*(1:200))
tru=exp(2*mus+2*sigs^2)
for (t in 1:200){
x=rnorm(1e5)
moy1[t]=mean(exp(2*sigs[t]*x+2*mus[t]))
moy2[t]=exp(2*mean(sigs[t]*x+mus[t])+2*var(sigs[t]*x+mus[t]))}

plot(moy1/tru,col="blue",ylab="relative mean",xlab="T",cex=.4,pch=19)
abline(h=1,col="orange")
lines((moy2/tru),col="green",cex=.4,pch=19)

Es liegt also tatsächlich ein Zusammenbruch des zweiten empirischen Moments vor, wenn und σ zunehmen, was ich der enormen Zunahme der Varianz des zweiten empirischen Moments zuschreiben würde, wenn μ und σ zunehmen.μσμσ

E[X2]X2X2e2μX2exp{2μ+2σϵ}ϵN(0,1)σσϵσ2XLN(μ,σ)

P(X2>E[X2])=P(log{X2}>2μ+2σ2)=P(μ+σϵ>μ+σ2)=P(ϵ>σ)=1Φ(σ)

1
Ich bin auch verwirrt. Ich
füge

Okay. Vielen Dank! Wenn ich ein paar Zahlen schreibe, sehe ich jetzt, dass meine magere Stichprobengröße wirklich nicht für die Aufgabe geeignet war!
user29918

2
σ

2
P(X2>E[X2])=1Φ(σ)σσ

2
σ

13

Ich dachte, ich würde ein paar Feigen werfen, die zeigen, dass sowohl User29918 als auch Xi'ans Pläne konsistent sind. In Abb. 1 ist dargestellt, was User29918 getan hat, und in Abb. 2 (basierend auf denselben Daten) ist dargestellt, was Xi'an für seine Handlung getan hat. Gleiches Ergebnis, andere Präsentation.

1nixi2

Weitere Kommentare:

  1. Ein unvoreingenommener Schätzer bedeutet nicht, dass der Schätzer in der Nähe sein soll! Die blauen Punkte müssen nicht der Erwartung entsprechen. Z.B. Eine zufällig ausgewählte Einzelbeobachtung ergibt eine unvoreingenommene Schätzung des Bevölkerungsmittelwerts, aber es ist nicht zu erwarten, dass dieser Schätzer nahe beieinander liegt.
  2. Das Problem taucht auf, da die Varianz absolut astronomisch wird. Da die Varianz durcheinanderbringt, wird die Schätzung für die erste Methode nur durch einige wenige Beobachtungen bestimmt. Sie haben auch eine winzige Wahrscheinlichkeit für eine Wahnsinnig, Wahnsinnig, Wahnsinnig große Zahl ...
  3. P(X2>E[X2])=1Φ(σ)σX2>E[X2]Bildbeschreibung hier eingeben

Bildbeschreibung hier eingeben

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.