Lassen Sie mich zunächst die Prämisse leugnen. Robert Geary hat den Fall wahrscheinlich nicht übertrieben, als er (1947) sagte: " ... Normalität ist ein Mythos; es gab und wird nie eine Normalverteilung geben. " -
Die Normalverteilung ist ein Modell *, ein Annäherung, die manchmal mehr oder weniger nützlich ist.
* (dazu siehe George Box , obwohl ich die Version in meinem Profil bevorzuge).
Dass einige Phänomene annähernd normal sind, mag keine große Überraschung sein, da Summen unabhängiger [oder sogar nicht zu stark korrelierter] Effekte sein sollten, wenn es viele von ihnen gibt und keine eine im Vergleich zur Varianz der substanzielle Varianz aufweist Alles in allem sieht die Verteilung normalerweise normaler aus.
n
Wenn standardisierte Mittel in etwa normal sind, sind dies natürlich standardisierte Summen. Dies ist der Grund für die Argumentation "Summe vieler Effekte". Wenn es also viele kleine Beiträge zu der Variation gibt und diese nicht stark korrelieren, werden Sie sie möglicherweise eher sehen.
Das Berry-Esseen-Theorem gibt uns eine Aussage darüber (Konvergenz zu Normalverteilungen), was tatsächlich mit standardisierten Stichprobenmitteln für iid-Daten geschieht (unter etwas strengeren Bedingungen als für die CLT, da es erfordert, dass der dritte absolute Moment endlich ist) und uns zu sagen, wie schnell es passiert. Nachfolgende Versionen des Theorems befassen sich mit nicht identisch verteilten Komponenten in der Summe , obwohl die Obergrenzen für die Abweichung von der Normalität weniger eng sind.
Weniger formal gibt uns das Verhalten von Windungen mit einigermaßen netten Verteilungen zusätzliche (wenn auch eng verwandte) Gründe für den Verdacht, dass es sich in vielen Fällen um eine faire Annäherung an endliche Stichproben handelt. Faltung fungiert als eine Art "Schmier" -Operator, mit dem Leute, die die Schätzung der Kerneldichte für eine Vielzahl von Kerneln verwenden, vertraut sind. Sobald Sie das Ergebnis standardisiert haben (damit die Varianz bei jeder solchen Operation konstant bleibt), ist beim wiederholten Glätten ein Fortschritt hin zu immer symmetrischeren Hügelformen zu erkennen (und es spielt keine Rolle, ob Sie den Kernel jedes Mal ändern).
Terry Tao gibt einige nette Diskussion Versionen des zentralen Grenzwertsatz und dem Satz von Berry-Esseen hier , und auf dem Weg erwähnt , einen Ansatz zu einer nicht-unabhängige Version von Berry-Esseen.
Es gibt also mindestens eine Klasse von Situationen, in denen wir dies erwarten könnten, und formale Gründe, zu glauben, dass dies in solchen Situationen tatsächlich der Fall sein wird. Im besten Fall ist jedoch jede Annahme, dass das Ergebnis von "Summen vieler Effekte" normal ist, eine Annäherung. In vielen Fällen ist dies eine durchaus vernünftige Annäherung (und in weiteren Fällen reagieren einige Verfahren, die von Normalität ausgehen, zumindest bei großen Stichproben nicht besonders empfindlich auf die Verteilung der einzelnen Werte).
Es gibt viele andere Umstände, in denen die Effekte sich nicht "addieren", und wir können erwarten, dass andere Dinge passieren. Beispielsweise sind bei vielen Finanzdaten die Auswirkungen in der Regel multiplikativ (die Auswirkungen verändern sich prozentual, z. B. in Bezug auf Zinsen, Inflation und Wechselkurse). Dort erwarten wir keine Normalität, aber wir können manchmal eine grobe Annäherung an die Normalität auf der logarithmischen Skala beobachten. In anderen Situationen kann beides nicht angemessen sein, auch nicht im groben Sinne. Beispielsweise werden Zwischenereigniszeiten im Allgemeinen weder durch die Normalität noch durch die Normalität von Protokollen gut angenähert. Es gibt hier weder "Summen" noch "Produkte" von Effekten, für die man argumentieren könnte. Es gibt zahlreiche andere Phänomene, die wir unter bestimmten Umständen für eine bestimmte Art von "Gesetz" argumentieren können.