Warum funktioniert die CLT Arbeit für

Wir wissen also, dass eine Summe von Poisson mit dem $n$ Parameter $\lambda$ selbst eine Poisson mit $n\lambda$ . So hypothetisch könnte man nehmen $x \sim poisson(\lambda = 1)$ und sagen , dass es tatsächlich ist $\sum_1^n x_i \sim poisson(\lambda = 1)$ , wobei jedes $x_i$ ist: $x_i \sim poisson(\lambda = 1/n)$ und nehmen Sie ein großes n, um CLT zum Laufen zu bringen.

Das funktioniert (offensichtlich) nicht. Ich nehme an, das hat etwas damit zu tun, wie CLT für Zufallsvariablen "schneller" arbeitet, die "näher" am Normalen liegen, und je kleiner Lambda ist, desto mehr erhalten wir eine Zufallsvariable, die meistens 0 ist und selten etwas anderes variiert.

Was ich jedoch erklärte, ist meine Intuition. Gibt es eine formellere Erklärung, warum dies der Fall ist?

Vielen Dank!

poisson-distribution central-limit-theorem asymptotics

— Tal Galili
quelle

Für den Anfang benötigt CLT, dass Sie

\sum_{i = 1}^{n} x_{i}

$\sum_{i=1}^nx_i$ durch

\sqrt{n}

$\sqrt{n}$ (in diesem Fall werden Sie zu einem Gaußschen konvergieren).

— Alex R.

@AlexR. Wenn Sie durch

dividieren

n

$n$ , ist die Standardabweichung ein Faktor von

1 / \sqrt{n}

$1/\sqrt n$

— Aksakal

Ich verstehe nicht, was diese Frage mit dem CLT "nicht funktioniert" zu tun hat. Die CLT betrifft standardisierte Summen von Zufallsvariablen mit einer bestimmten Verteilung, während Sie einen Einnahme einzelnen Zufallsvariable und Betrachtung unendlich viele Möglichkeiten der Teilung es auf.

— Whuber

@AlexR Das Setup scheint völlig falsch zu sein. Hier laufen zwei verschiedene Prozesse ab - Summation und Division - und es gibt keinen Grund anzunehmen, dass sie ähnliche asymptotische Eigenschaften haben sollten.

— whuber

@Aksakal: Eigentlich ist AlexR richtig. Wenn Sie durch

dividieren , erhalten Sie eine entartete Verteilung als

. Wenn Sie durch

n

$n$

n \to \infty

$n \rightarrow \infty$

nähern Sie sich einer Normalverteilung mit sd = 1 als

\sqrt{n}

$\sqrt n$

n \to \infty

$n \rightarrow \infty$

— Cliff AB

Antworten:

Ich stimme @whuber zu, dass die Wurzel der Verwirrung darin zu liegen scheint, die asymptotische Summierung in CLT durch eine Art Teilung in Ihrem Argument zu ersetzen. In CLT erhalten wir die feste Verteilung dann ziehen Zahlen aus ihr und berechnen die Summe $f(x,\lambda)$ $n$ $x_i$ . Wenn wirweitererhöhen, passiert etwas Interessantes: $\bar x_n=\frac{1}{n}\sum_{i=1}^nx_i$ $n$ wobeiMittelwert und die Varianz der Verteilung.

\sqrt{n} ({\bar{x}}_{n} - μ) \to N (0, σ^{2})

$\sqrt n (\bar x_n-\mu)\rightarrow\mathcal{N}(0,\sigma^2)$

μ, σ^{2}

$\mu,\sigma^2$

f (x)

$f(x)$

Was Sie mit Poisson vorschlagen, ist etwas rückwärts: Anstatt die Variablen aus einer festen Verteilung zu summieren , möchten Sie die feste Verteilung in sich ständig ändernde Teile aufteilen . Mit anderen Worten, Sie nehmen eine Variable aus einer festen Verteilung und teilen sie dann in so dass $x$ $f(x,\lambda)$ $x_i$

\sum_{i = 1}^{n} x_{i} \equiv x

$\sum_{i=1}^nx_i\equiv x$

Was sagt CLT über diesen Prozess? Nichts. Beachten Sie, wie wir in CLT jemals und seine sichänderndeVerteilung, die zu einerfestenVerteilungkonvergiert $\sqrt n(\bar x_n-\mu)$ $f_n(x)$ $\mathcal{N}(0,\sigma^2)$

In Ihrem Setup ändern sich weder die Summe noch deren Verteilung ! Sie sind repariert. Sie ändern sich nicht, sie laufen zu nichts zusammen. CLT hat also nichts zu sagen. $x$ $f(x,\lambda)$

Außerdem sagt CLT nichts über die Anzahl der Elemente in der Summe aus. Sie können eine Summe von 1000 Variablen aus Poisson (0,001) haben, und CLT sagt nichts über die Summe aus. Es heißt nur, wenn Sie N weiter erhöhen, sieht diese Summe irgendwann aus wie eine Normalverteilung . In der Tat, wenn N = 1.000.000, erhalten Sie die enge Annäherung an die Normalverteilung. $\frac{1}{N}\sum_{i=1}^N x_i, x_i\sim Poisson(0.001)$

Ihre Intuition stimmt nur in Bezug auf die Anzahl der Elemente in der Summe, dh wenn sich die Anfangsverteilung von der normalen Verteilung unterscheidet, müssen Sie mehr Elemente summieren, um zur normalen Verteilung zu gelangen. Je mehr formale (aber informell noch) Art und Weise , indem man die charakteristische Funktion von Poisson würde: Wenn Sie , erhalten Sie mit der Taylor - Entwicklung (WRT ) des verschachtelten Exponenten:

\exp (λ (\exp (i t) - 1))

$\exp(\lambda (\exp(it)-1))$

λ >> 1

$\lambda>>1$

t

$t$

Dies ist die charakteristische Funktion der Normalverteilung

\approx \exp (i λ t - λ / 2 t^{2})

$\approx\exp(i\lambda t-\lambda/2t^2)$

N (λ, λ^{2})

$\mathcal{N}(\lambda,\lambda^2)$

Ihre Intuition wird jedoch nicht richtig angewendet: Wenn Sie die Summe in CLT durch eine Art Division verschieben, wird die Sache durcheinander gebracht und CLT wird nicht anwendbar.

— Aksakal
quelle

+1 Das vorbereitende Material ist gut formuliert, sehr klar und bringt das Thema auf den Punkt.

— Whuber

Das Problem bei Ihrem Beispiel ist, dass Sie zulassen, dass sich die Parameter ändern, wenn sich ändert. Die CLT sagt Ihnen, dass für eine feste Verteilung mit einem endlichen Mittelwert und sd, als , $n$ $n \rightarrow \infty$

, $\frac {\sum x - \mu} {\sqrt n} \rightarrow_d N(0, \sigma)$

wobei und aus dem Mittelwert und sd der Verteilung von . $\mu$ $\sigma$ $x$

Natürlich sind für verschiedene Verteilungen (z. B. höhere Versetzungen) größere erforderlich, bevor die aus diesem Theorem abgeleitete Approximation vernünftig wird. In Ihrem Beispiel für , ein erforderlich ist , bevor die normale Annäherung sinnvoll ist. $n$ $\lambda_m = 1/m$ $n >> m$

BEARBEITEN

Es wird diskutiert, wie die CLT nicht für Summen gilt, sondern für standardisierte Summen (dh nicht). Theoretisch ist dies natürlich richtig: Die nicht standardisierte Summe wird in den meisten Fällen eine undefinierte Verteilung haben. $\sum x_i / \sqrt n$ $\sum x_i$

In der Praxis können Sie die vom CLT begründete Annäherung jedoch durchaus auf Summen anwenden! Wenn durch eine normale CDF für großes angenähert werden kann , dann kann sicherlich auch, da die Multiplikation mit einem Skalar die Normalität bewahrt. Und das können Sie gleich in diesem Problem sehen: Denken Sie daran, dass, wenn , dann $F_{\bar x}$ $n$ $F_{\sum x}$ $X_i \sim Pois(\lambda)$ $Y = \sum_{i = 1}^n X_i \sim Pois(n\lambda)$ . Und wir alle haben in unserem oberen Teilungswahrscheinlichkeitskurs gelernt, dass für großes die CDF eines recht gut durch eine Normale mit , angenähert werden kann . Also für jeden festen , können wir die CDF von annähernd recht gut mit $\lambda$ $Pois(\lambda)$ $\mu = \lambda$ $\sigma^2 = \lambda$ $\lambda$ $Y \sim Pois(n\lambda)$ für ein ausreichend großeswenn(eine Näherung kann trivial angewendet werden, wenn, aber nicht die Berechnung der CDF, wie ich sie geschrieben habe). $\Phi( \frac{y - n\lambda}{\sqrt{n\lambda} })$ $n$ $\lambda > 0$ $\lambda = 0$

Während die CLT nicht ohne weiteres für Summen gilt, gilt die auf der CLT basierende Annäherung mit Sicherheit. Ich glaube, darauf bezog sich das OP, als es darum ging, die CLT auf die Summe anzuwenden.

— Cliff AB
quelle

Ich behaupte, die Frage ist interessanter, wenn man allgemeiner darüber nachdenkt, wie die Verteilung des übergeordneten Poisson von abhängt , beispielsweise mit den Parametern und als Sonderfall. Ich halte es für vernünftig zu fragen, warum und wie wir das verstehen können, dass ein zentraler Grenzwertsatz für die Summe . Schließlich ist es üblich, eine CLT auch bei Problemen anzuwenden, bei denen die Verteilungen der Komponenten der Summe von abhängen $n$ $\lambda_n$ $\lambda_n = 1$ $S_n = \sum_{i=1}^n X_{i,n}$ $n$ . Es ist auch üblich, Poisson-Verteilungen als Verteilung einer Summe von Poisson-Variablen zu zerlegen und dann eine CLT anzuwenden.

$X_{i, n}$ $n$ $S_n$ $n$ $S_n \sim Poi(n)$ $Poi(\lambda_n)$

$S_n \sim Poi(1)$ $n$ $S_n$

$s_n^2 = \mathrm{Var(S_n)}$ $\forall \epsilon >0$

\frac{1}{s_{n}^{2}} \sum_{ich = 1}^{n} E [X_{ich, n} - 1 / n]^{2} ich (| X_{ich, n} - 1 / n | > ϵ s_{n}) \to 0, n \to \infty

$\frac{1}{s_n^2}\sum_{i=1}^n\mathbb E[X_{i,n} - 1/n]^2I(\vert X_{i,n} - 1/n \vert >\epsilon s_n) \to 0,n\to\infty$

Nun, für den vorliegenden Fall, stirbt die Varianz der Terme in der Summe so schnell ab $n$ $s_n = 1$ $n$ $n$ $X_{i,n}$

n E [X_{1, n} - 1 / n]^{2} ich (| X_{1, n} - 1 / n | > ϵ) \to 0.

$n\mathbb E[X_{1,n} - 1/n]^2I(\vert X_{1,n} - 1/n \vert >\epsilon) \to 0.$

$\epsilon$ $n$

\begin{aligned} n E [X_{1, n} - 1 / n]^{2} I (| X_{1, n} - 1 / n | > ϵ) & > n ϵ^{2} P (X_{1, n} > 0) \\ = ϵ^{2} n [1 - e^{- 1 / n}] \\ = ϵ^{2} n [1 - (1 - 1 / n + Ö (1 / n))] \\ = ϵ^{2} + Ö (1), \end{aligned}

$\begin{align} n\mathbb E[X_{1,n} - 1/n]^2I(\vert X_{1,n} - 1/n \vert >\epsilon) &>n\epsilon^2P(X_{1,n}>0) \\ &=\epsilon^2n[1 - e^{-1/n}] \\ &= \epsilon^2n[1-(1 - 1/n + o(1/n))] \\ &= \epsilon^2 + o(1), \end{align}$

$S_n$ $n$ $n$

— ekvall
quelle

+1 Dies beleuchtet auch einen Kommentar von @AlexR zur Frage.

— Whuber