Gibt es Beispiele für eine normalverteilte Variable, die * nicht * auf den zentralen Grenzwertsatz zurückzuführen ist?

Die Normalverteilung scheint nicht intuitiv zu sein, bis Sie die CLT lernen, was erklärt, warum sie im wirklichen Leben so verbreitet ist. Aber entsteht es jemals als "natürliche" Verteilung für eine bestimmte Menge?

normal-distribution central-limit-theorem

— Gartenkopf
quelle

Die physikalische Diffusionstheorie sagt, soweit sie auf jedes System anwendbar ist, Normalverteilungen von Größen (wie Temperatur oder Konzentration) voraus, die an einem Punkt entstehen. In der Tat sind sehr viele Systeme diffus (Optionspreise, Partikeltransport in homogenen Medien usw.), was darauf hindeutet, dass es zahlreiche Beispiele gibt, vorausgesetzt, man ist nicht so naiv, dass man annimmt, dass eine Normalverteilung genau unrealistisch großen oder kleinen Werten standhalten muss - das wäre ein Missverständnis aller physikalischen Theorie.

— whuber

Die Normalverteilung scheint nicht intuitiv zu sein, bis Sie feststellen, dass sie die Entropie unter der Bedingung einer festen Varianz maximiert.

— Leonbloy

Antworten:

Bis zu einem gewissen Grad denke ich, dass dies sowohl ein philosophisches als auch ein statistisches Thema sein kann.

Viele natürlich vorkommende Phänomene sind ungefähr normal verteilt. Man kann argumentieren, ob die zugrunde liegende Ursache dafür so etwas wie das CLT sein kann:

Die Körpergröße von Menschen kann als die Summe vieler kleinerer Ursachen (möglicherweise unabhängig, unwahrscheinlich identisch verteilt) betrachtet werden: Längen verschiedener Knochen oder Ergebnisse verschiedener Genexpressionen oder Ergebnisse vieler diätetischer Einflüsse oder eine Kombination aller oben genannten .
Testergebnisse können als die Summe der Ergebnisse für viele einzelne Testfragen betrachtet werden (möglicherweise identisch verteilt, unwahrscheinlich völlig unabhängig).
Entfernung, die ein Partikel aufgrund der Brownschen Bewegung in einer Flüssigkeit in einer Dimension zurücklegt: Bewegung kann abstrakt als zufälliger Gang betrachtet werden, der aus zufälligen IID-Treffern von Molekülen resultiert.

Ein Beispiel, bei dem die CLT nicht unbedingt beteiligt ist, ist die Streuung der Schüsse um ein Bullauge: Der Abstand vom Bullauge kann als Rayleigh-Verteilung (proportional zur Quadratwurzel von Chi-Quadrat mit 2 DF) und der Winkel gegen den Uhrzeigersinn von modelliert werden Die positive horizontale Achse kann als einheitlich auf modelliert werdenNach dem Wechsel von polaren zu rechteckigen Koordinaten erweisen sich Abstände in horizontaler (x) und vertikaler (y) Richtung als unkorrelierte bivariate Normalen. [Dies ist die Essenz der Box-Muller-Transformation, die Sie googeln können.] Die normalen x- und y-Koordinaten können jedoch als die Summe vieler kleiner Ungenauigkeiten beim Targeting betrachtet werden, die einen CLT-bezogenen Mechanismus im Hintergrund rechtfertigen könnten . $(0, 2\pi).$

Im historischen Sinne kann die weit verbreitete Verwendung von Normalverteilungen (Gaußschen Verteilungen) anstelle von Doppelexponentialverteilungen (Laplace-Verteilungen) zur Modellierung astronomischer Beobachtungen teilweise auf die CLT zurückzuführen sein. In den frühen Tagen der Modellierung von Fehlern solcher Beobachtungen gab es eine Debatte zwischen Gauß und Laplace , die jeweils für ihre eigene Lieblingsverteilung plädierten. Aus verschiedenen Gründen hat sich das normale Modell durchgesetzt. Man kann argumentieren, dass ein Grund für den möglichen Erfolg der Normalverteilung die mathematische Bequemlichkeit war, die auf normalen Grenzen der CLT beruhte. Dies scheint auch dann der Fall zu sein, wenn unklar ist, welche Verteilungsfamilie die bessere Anpassung bietet. (Selbst jetzt gibt es noch Astronomen, die glauben, dass die "beste Beobachtung"Von einem akribischen, angesehenen Astronomen gemacht, ist sicherlich ein besserer Wert als der Durchschnitt vieler Beobachtungen, die von vermutlich weniger begabten Beobachtern gemacht wurden. Tatsächlich würden sie es vorziehen, wenn Statistiker überhaupt nicht eingreifen würden.)

— BruceET
quelle

Ja. Tippfehler werden immer noch behoben. Danke, dass du das bemerkt hast. Der gleiche Fehler in den 'Testergebnissen' wurde ebenfalls behoben.

— BruceET

-3

Viele natürlich vorkommende Variablen sind normal verteilt. Höhen von Menschen? Größe der Tierkolonien?

— glücklich
quelle

@Happy Tatsächlich ist keines der hier angegebenen Beispiele normalverteilt, da die Unterstützung der Normalverteilung -infinity bis + unendlich ist und die angegebenen Beispiele niemals Null oder weniger sein können. In jedem Fall könnte die Normalverteilung eine nützliche Annäherung sein, aber nicht, wenn Sie an den Schwänzen der Verteilung interessiert waren.

— JeremyC

Menschliche Körpergröße ist das Ergebnis der Summe von (ungefähr) unabhängigen Genen, so dass sie tatsächlich sind auf die CLT fällig.

— Gardenhead

@ArtemMavrin: Eine negative Höhe zu erreichen wäre ungefähr 8+ Standardabweichungen. Wenn man einer normalen Näherung widerspricht, die nicht gültig ist, weil sie eine Wahrscheinlichkeitsmasse von Null über 8 sd hinaus platziert, können Sie sich genauso gut darüber beschweren, dass ein wirklich normalverteilter Wert mit der Wahrscheinlichkeit 1 irrational ist, aber alle unsere Messungen sind rationale Zahlen.

— Cliff AB

@ArtemMavrin: Nun, wenn die Frage genau normal verteilt ist, ist diese Antwort einfach: Nein. Nicht einmal rnorm(1). Gleich mit allen Distributionen außer Multinomial.

— Cliff AB

n \to \infty

$n\to\infty$