Zentraler Grenzwertsatz für Quadratwurzeln von Summen von iid-Zufallsvariablen

Ich bin fasziniert von einer Frage bei math.stackexchange und untersuche sie empirisch. Ich wundere mich über die folgende Aussage über die Quadratwurzel von Summen von iid-Zufallsvariablen.

Angenommen, sind iid Zufallsvariablen mit einem endlichen Mittelwert ungleich Null und Varianz und . Der zentrale Grenzwertsatz besagt wenn zunimmt. $X_1, X_2, \ldots, X_n$ $\mu$ $\sigma^2$ $\displaystyle Y=\sum_{i=1}^n X_i$ $\displaystyle \dfrac{Y - n\mu}{\sqrt{n\sigma^2}} \ \xrightarrow{d}\ N(0,1)$ $n$

Wenn , kann ich auch so etwas wie sagen wenn zunimmt? $Z=\sqrt{|Y|}$ $\displaystyle \dfrac{Z - \sqrt{n |\mu|-\tfrac{\sigma^2}{4|\mu|}}}{\sqrt{\tfrac{\sigma^2}{4|\mu|}}}\ \xrightarrow{d}\ N(0,1)$ $n$

Angenommen, die sind Bernoulli mit dem Mittelwert und der Varianz , dann ist binomial und ich kann dies in R simulieren, beispielsweise mit : $X_i$ $p$ $p(1-p)$ $Y$ $p=\frac13$

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

Dies ergibt ungefähr den erhofften Mittelwert und die erhoffte Varianz für $Z$

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

und ein QQ-Diagramm, das Gauß nahe kommt

qqnorm(Z)

normal-distribution central-limit-theorem sum

— Henry
quelle

@ MichaelM: Danke für diese Kommentare. Ich hatte mit dem nicht negativen begonnen , aber ich dachte, das von Ihnen beschriebene intuitive asymptotische Verhalten ermöglichte eine Verallgemeinerung auf mehr Verteilungen. Meine Überraschungen waren (a) die Varianz der Quadratwurzel der Summe, die anscheinend zu einer Konstanten tendiert, die nicht von abhängt, und (b) das Auftreten einer Verteilung, die Gauß sehr nahe kommt. Ein Gegenbeispiel wäre willkommen, aber als ich andere Fälle ausprobierte, die anfangs nicht Gaußsch wirkten, schien eine weitere Erhöhung von die Verteilung wieder auf ein CLT-Ergebnis zu bringen.

X_{i}

$X_i$

n

$n$

n

$n$

— Henry

Eine Folge davon ist der quadratische Mittelwert (oder quadratische Mittelwert) von iid-Zufallsvariablen, der in geeigneter Weise skaliert ist (multipliziert mit wie bei einem arithmetischen Mittelwert), konvergiert ebenfalls zu einer Gaußschen Verteilung, vorausgesetzt, das Moment des Die zugrunde liegende Verteilung ist endlich.

\sqrt{n}

$\sqrt{n}$

4

$4$

— Henry

Nur ein kurzer Kommentar: Die Behauptung ist ein Sonderfall der Delta-Methode, siehe Satz 5.5.24 im Buch "Statistical Inference" von Casella & Berger.

— Michael M

@Michael: Vielleicht sehen Sie etwas, das ich im Moment nicht bin, aber ich denke nicht, dass dieses spezielle Problem in die Annahmen der klassischen Delta-Methode passt (z. B. wie in dem Satz angegeben, auf den Sie verweisen). Beachten Sie, dass in der Verteilung nicht konvergiert (nicht trivial auf ) und daher "die Delta-Methode mit anwenden " nicht die erforderlichen Anforderungen erfüllt. Wie die Antwort von S. Catterall jedoch zeigt, bietet sie eine nützliche Heuristik, die zur richtigen Antwort führt.

Y

$Y$

R

$\mathbb R$

g (y) = \sqrt{| y |}

$g(y) = \sqrt{|y|}$

— Kardinal

(Ich glaube, Sie könnten den Beweis der Delta-Methode an Fälle anpassen, die den oben genannten ähnlich sind, um die oben genannte Heuristik vollständig rigoros zu machen.)

— Kardinal

Die Konvergenz zu einem Gaußschen ist in der Tat ein allgemeines Phänomen.

Angenommen, sind IID-Zufallsvariablen mit dem Mittelwert und der Varianz , und definieren Sie die Summen . Fixiere eine Zahl . Der übliche zentrale Grenzwertsatz besagt, dass als , wobei ist das standard normale cdf. Die Kontinuität des einschränkenden cdf impliziert jedoch, dass wir auch $X_1,X_2,X_3,...$ $\mu\gt 0$ $\sigma^2$ $Y_n=\sum_{i=1}^n X_i$ $\alpha$ $P(\frac{Y_n-n\mu}{\sigma\sqrt n}\leq \alpha)\to\Phi(\alpha)$ $n\to\infty$ $\Phi$

P (\frac{Y_{n} - n μ}{σ \sqrt{n}} \leq α + \frac{α^{2} σ^{2}}{4 μ σ \sqrt{n}}) \to Φ (α)

$P\Big(\frac{Y_n-n\mu}{\sigma\sqrt n}\leq \alpha+\frac{\alpha^2 \sigma^2}{4\mu\sigma\sqrt n}\Big)\to\Phi(\alpha)$ weil der zusätzliche Term auf der rechten Seite der Ungleichung gegen Null tendiert. Das Umordnen dieses Ausdrucks führt zu

P (Y_{n} \leq (\frac{α σ}{2 \sqrt{μ}} + \sqrt{n μ})^{2}) \to Φ (α)

$P\Big(Y_n\leq (\frac{\alpha\sigma}{2\sqrt \mu}+\sqrt{n\mu})^2\Big)\to\Phi(\alpha)$

Wenn wir Quadratwurzeln ziehen und feststellen, dass impliziert, dass , erhalten wir Mit anderen Worten, . Dieses Ergebnis zeigt die Konvergenz zu einem Gaußschen im Grenzwert als . $\mu\gt 0$ $P(Y_n\lt 0)\to 0$

P (\sqrt{| Y_{n} |} \leq \frac{α σ}{2 \sqrt{μ}} + \sqrt{n μ}) \to Φ (α)

$P\Big(\sqrt{|Y_n|}\leq \frac{\alpha\sigma}{2\sqrt \mu}+\sqrt{n\mu}\Big)\to\Phi(\alpha)$

\frac{\sqrt{| Y_{n} |} - \sqrt{n μ}}{σ / 2 \sqrt{μ}} \overset{d}{\to} N (0, 1)

$\frac{\sqrt{|Y_n|}-\sqrt{n\mu}}{\sigma/{2\sqrt\mu}}\xrightarrow{d}N(0,1)$

n \to \infty

$n\to\infty$

Bedeutet dies, dass eine gute Annäherung an für großes ? Nun, wir können es besser machen. Wie @Henry bemerkt, können wir unter der Annahme, dass alles positiv ist, zusammen mit und die Approximation , um die verbesserte Approximation wie in der obigen Frage angegeben. Beachten Sie auch, dass wir immer noch weil $\sqrt{n\mu}$ $E[\sqrt{|Y_n|}]$ $n$ $E[\sqrt{Y_n}]=\sqrt{E[Y_n]-\text{Var}(\sqrt{Y_n})}$ $E[Y_n]=n\mu$ $\text{Var}(\sqrt{Y_n})\approx \frac{\sigma^2}{4\mu}$ $E[\sqrt{|Y_n|}]\approx\sqrt{n\mu- \dfrac{\sigma^2}{4\mu}}$

\frac{\sqrt{| Y_{n} |} - \sqrt{n μ - \frac{σ^{2}}{4 μ}}}{σ / 2 \sqrt{μ}} \overset{d}{\to} N (0, 1)

$\frac{\sqrt{|Y_n|}-\sqrt{n\mu-\frac{\sigma^2}{4\mu}}}{\sigma/{2\sqrt\mu}}\xrightarrow{d}N(0,1)$

\sqrt{n μ - \frac{σ^{2}}{4 μ}} - \sqrt{n μ} \to 0

$\sqrt{n\mu-\frac{\sigma^2}{4\mu}}-\sqrt{n\mu}\to 0$ als .

n \to \infty

$n\to\infty$

— S. Catterall stellt Monica wieder her
quelle

Möglicherweise müssen Sie als hinzufügen , um mein Ergebnis zu erhalten

\sqrt{n μ} - \sqrt{n μ - \frac{σ^{2}}{4 μ}} \to 0

$\sqrt{n \mu}-\sqrt{n \mu-\tfrac{\sigma^2}{4\mu}} \to 0$

n \to \infty

${n \to \infty}$

— Henry

@Henry Sie können für jede Konstante durch ersetzen. Dies ändert nicht die Grenzverteilung, kann jedoch den Grad ändern, in dem ist eine gute Annäherung an für ein bestimmtes großes . Wie sind Sie auf ?

\sqrt{n μ}

$\sqrt{n\mu}$

\sqrt{n μ - k}

$\sqrt{n\mu-k}$

k

$k$

\frac{\sqrt{| Y_{n} |} - \sqrt{n μ - k}}{σ / 2 \sqrt{μ}}

$\frac{\sqrt{|Y_n|}-\sqrt{n\mu-k}}{\sigma/{2\sqrt\mu}}$

N (0, 1)

$N(0,1)$

n

$n$

\sqrt{n μ - \frac{σ^{2}}{4 μ}}

$\sqrt{n \mu-\tfrac{\sigma^2}{4\mu}}$

— S. Catterall stellt Monica

Wir haben also . Unter der Annahme, dass alles positiv ist, ist während der Nenner von schlägt , und das Kombinieren dieser führt zu .

Var (Z) = E [Z^{2}] - (E [Z])^{2}

$\text{Var}(Z)=E[Z^2]-(E[Z])^2$

E [Z] = \sqrt{E [Z^{2}] - Var (Z)}

$E[Z]=\sqrt{E[Z^2]-\text{Var}(Z)}$

E [Z^{2}] = E [Y] = n μ

$E[Z^2]=E[Y]=n\mu$

\frac{\sqrt{| Y_{n} |} - \sqrt{n μ}}{σ / 2 \sqrt{μ}}

$\frac{\sqrt{|Y_n|}-\sqrt{n\mu}}{\sigma/{2\sqrt\mu}}$

Var (Z) \approx \frac{σ^{2}}{4 μ}

$\text{Var}(Z) \approx \dfrac{\sigma^2}{4\mu}$

E [Z] \approx \sqrt{n μ - \frac{σ^{2}}{4 μ}}

$E[Z] \approx \sqrt{n\mu- \dfrac{\sigma^2}{4\mu}}$

— Henry

Ok, danke, ich habe versucht, dies jetzt in meiner Antwort zu behandeln.

— S. Catterall stellt Monica