Zeitverzerrungsschätzer der logarithmischen Normalverteilung

Ich mache ein numerisches Experiment, das darin besteht, eine logarithmische Normalverteilung und die Momente mit zwei Methoden zu schätzen : $X\sim\mathcal{LN}(\mu, \sigma)$ $\mathbb{E}[X^n]$

Betrachtet man den Stichprobenmittelwert von $X^n$
Schätzen von $\mu$ und $\sigma^2$ unter Verwendung der Beispielmittel für $\log(X), \log^2(X)$ und dann unter Verwendung der Tatsache, dass für eine lognormale Verteilung $\mathbb{E}[X^n]=\exp(n \mu + (n \sigma)^2/2)$ .

Die Frage ist :

Ich finde experimentell, dass die zweite Methode viel besser funktioniert als die erste, wenn ich die Anzahl der Samples festhalte und $\mu, \sigma^2$ um einen Faktor T erhöhe . Gibt es eine einfache Erklärung für diese Tatsache?

Ich füge eine Abbildung bei, in der die x-Achse T ist, während die y-Achse die Werte von $\mathbb{E}[X^2]$ , die die wahren Werte von $\mathbb{E}[X^2] = \exp(2 \mu + 2 \sigma^2)$ (orange Linie) zu den geschätzten Werten. Methode 1 - blaue Punkte, Methode 2 - grüne Punkte. Die y-Achse ist in der logarithmischen Skala

$Wahre und geschätzte Werte für $ \ mathbb {E} [X ^ 2] $. Blaue Punkte sind Stichprobenmittelwerte für $ \ mathbb {E} [X ^ 2] $ (Methode 1), während die grünen Punkte die Schätzwerte nach Methode 2 sind. Die orange Linie wird aus den bekannten $ \ mu $, $ \ berechnet. Sigma $ nach der gleichen Gleichung wie in Methode 2. Die y-Achse ist in logarithmischem Maßstab$

BEARBEITEN:

Unten finden Sie einen minimalen Mathematica-Code, um die Ergebnisse für ein T mit der Ausgabe zu erzeugen:

   ClearAll[n,numIterations,sigma,mu,totalTime,data,rmomentFromMuSigma,rmomentSample,rmomentSample]
(* Define variables *)
n=2; numIterations = 10^4; sigma = 0.5; mu=0.1; totalTime = 200;
(* Create log normal data*)
data=RandomVariate[LogNormalDistribution[mu*totalTime,sigma*Sqrt[totalTime]],numIterations];

(* the moment by theory:*)
rmomentTheory = Exp[(n*mu+(n*sigma)^2/2)*totalTime];

(*Calculate directly: *)
rmomentSample = Mean[data^n];

(*Calculate through estimated mu and sigma *)
muNumerical = Mean[Log[data]]; (*numerical \[Mu] (gaussian mean) *)
sigmaSqrNumerical = Mean[Log[data]^2]-(muNumerical)^2; (* numerical gaussian variance *)
rmomentFromMuSigma = Exp[ muNumerical*n + (n ^2sigmaSqrNumerical)/2];

(*output*)
Log@{rmomentTheory, rmomentSample,rmomentFromMuSigma}

Ausgabe:

(*Log of {analytic, sample mean of r^2, using mu and sigma} *)
{140., 91.8953, 137.519}

oben ist das zweite Ergebnis der Stichprobenmittelwert von $r^2$ , der unter den beiden anderen Ergebnissen liegt

— user29918
quelle

Ein unbefangener Schätzer impliziert nicht , dass die blauen Punkte in der Nähe des erwarteten Wertes liegen sollten (orange Kurve). Ein Schätzer kann unvoreingenommen sein, wenn er eine hohe Wahrscheinlichkeit hat, zu niedrig zu sein, und eine geringe (möglicherweise verschwindend geringe) Wahrscheinlichkeit, viel zu hoch zu sein. Das passiert, wenn T zunimmt und die Varianz riesengroß wird (siehe meine Antwort).

— Matthew Gunn

Informationen dazu , wie Sie unvoreingenommene Schätzer erhalten, finden Sie unter stats.stackexchange.com/questions/105717 . UMVUEs des Mittelwerts und der Varianz sind in den Antworten und Kommentaren dazu angegeben.

— Whuber

Antworten:

In diesen Ergebnissen liegt seitdem etwas Rätselhaftes

Die erste Methode liefert einen unverzerrten Schätzer für , nämlich $\mathbb{E}[X^2]$ hatals Mittelwert. Daher sollten die blauen Punkte um den erwarteten Wert liegen (orange Kurve). $\frac{1}{N} \sum_{i = 1}^{N} X_{i}^{2}$ $\frac{1}{N}\sum_{i=1}^N X_i^2$ $\mathbb{E}[X^2]$
Das zweite Verfahren stellt einen vorgespannten Schätzer von , nämlich , wenn und sind unvoreingenommene Schätzer von und $\mathbb{E}[X^2]$ $E [\exp (n \hat{μ} + n^{2} {\hat{σ}}^{2} / 2)] > \exp (n μ + (n σ)^{2} / 2)$ $\mathbb{E}[\exp(n \hat\mu + n^2 \hat{\sigma}^2/2)]>\exp(n \mu + (n \sigma)^2/2)$ $\hat\mu$ $\hat\sigma²$ $\mu$ $\sigma²$ und es ist daher merkwürdig, dass die grünen Punkte mit der orangefarbenen Kurve ausgerichtet sind.

aber sie sind auf das Problem und nicht auf die numerischen Berechnungen zurückzuführen: Ich wiederholte das Experiment in R und erhielt das folgende Bild mit dem gleichen Farbcode und der gleichen Folge von und , die jeden geteilten Schätzer darstellen von der wahren Erwartung: $\mu_T$ $\sigma_T$

Hier ist der entsprechende R-Code:

moy1=moy2=rep(0,200)
mus=0.14*(1:200)
sigs=sqrt(0.13*(1:200))
tru=exp(2*mus+2*sigs^2)
for (t in 1:200){
x=rnorm(1e5)
moy1[t]=mean(exp(2*sigs[t]*x+2*mus[t]))
moy2[t]=exp(2*mean(sigs[t]*x+mus[t])+2*var(sigs[t]*x+mus[t]))}

plot(moy1/tru,col="blue",ylab="relative mean",xlab="T",cex=.4,pch=19)
abline(h=1,col="orange")
lines((moy2/tru),col="green",cex=.4,pch=19)

Es liegt also tatsächlich ein Zusammenbruch des zweiten empirischen Moments vor, wenn und zunehmen, was ich der enormen Zunahme der Varianz des zweiten empirischen Moments zuschreiben würde, wenn und zunehmen. $\mu$ $\sigma$ $\mu$ $\sigma$

$\mathbb{E}[X^2]$ $X^2$ $X^2$ $e^{2\mu}$ $X^2$ $\exp\{2\mu+2\sigma\epsilon\}$ $\epsilon\sim\mathcal{N}(0,1)$ $\sigma$ $\sigma\epsilon$ $\sigma^2$ $X$ $\mathcal{LN}(\mu,\sigma)$
$\begin{aligned} P (X^{2} > E [X^{2}]) & = P (\log {X^{2}} > 2 μ + 2 σ^{2}) \\ = P (μ + σ ϵ > μ + σ^{2}) \\ = P (ϵ > σ) \\ = 1 - Φ (σ) \end{aligned}$ $\begin{align*}\mathbb{P}(X^2>\mathbb{E}[X^2])&=\mathbb{P}(\log\{X^2\}>2\mu+2\sigma^2)\\&=\mathbb{P}(\mu+\sigma\epsilon>\mu+\sigma^2)\\&=\mathbb{P}(\epsilon>\sigma)\\ &=1-\Phi(\sigma)\end{align*}$

— Xi'an
quelle

Ich bin auch verwirrt. Ich

— füge

Okay. Vielen Dank! Wenn ich ein paar Zahlen schreibe, sehe ich jetzt, dass meine magere Stichprobengröße wirklich nicht für die Aufgabe geeignet war!

— user29918

σ

$\sigma$

P (X^{2} > E [X^{2}]) = 1 - Φ (σ)

$P(X^2 > \mathbb{E}[X^2]) = 1 - \Phi(\sigma)$

σ

$\sigma$

σ

$\sigma$

σ

$\sigma$

Ich dachte, ich würde ein paar Feigen werfen, die zeigen, dass sowohl User29918 als auch Xi'ans Pläne konsistent sind. In Abb. 1 ist dargestellt, was User29918 getan hat, und in Abb. 2 (basierend auf denselben Daten) ist dargestellt, was Xi'an für seine Handlung getan hat. Gleiches Ergebnis, andere Präsentation.

$\frac{1}{n} \sum_i x_i^2$

Weitere Kommentare:

Ein unvoreingenommener Schätzer bedeutet nicht, dass der Schätzer in der Nähe sein soll! Die blauen Punkte müssen nicht der Erwartung entsprechen. Z.B. Eine zufällig ausgewählte Einzelbeobachtung ergibt eine unvoreingenommene Schätzung des Bevölkerungsmittelwerts, aber es ist nicht zu erwarten, dass dieser Schätzer nahe beieinander liegt.
Das Problem taucht auf, da die Varianz absolut astronomisch wird. Da die Varianz durcheinanderbringt, wird die Schätzung für die erste Methode nur durch einige wenige Beobachtungen bestimmt. Sie haben auch eine winzige Wahrscheinlichkeit für eine Wahnsinnig, Wahnsinnig, Wahnsinnig große Zahl ...
$P(X^2 > E[X^2]) = 1 - \Phi(\sigma)$ $\sigma$ $X^2 > E[X^2]$

— Matthew Gunn
quelle