Die klassische Anweisung des zentralen Grenzwertsatzes (CLT) betrachtet eine Folge von unabhängigen, identisch verteilten Zufallsvariablen mit gemeinsamem Verteiler F . Diese Sequenz modelliert die Situation, mit der wir beim Entwerfen eines Stichprobenprogramms oder Experiments konfrontiert sind: Wenn wir n unabhängige Beobachtungen desselben zugrunde liegenden Phänomens erhalten können, dann ist die endliche Sammlung X 1 , X 2 , … , X nX.1, X.2, … , X.n, …F.nX.1, X.2, … , X.nmodelliert die erwarteten Daten. Das Zulassen, dass die Sequenz unendlich ist, ist eine bequeme Möglichkeit, beliebig große Stichprobengrößen zu betrachten.
Verschiedene Gesetze großer Zahlen behaupten, dass der Mittelwert
m ( X.1, X.2, … , X.n) = 1n( X.1+ X.2+ ⋯ + X.n)
wird sich mit hoher Wahrscheinlichkeit der Erwartung von , μ ( F ) nähern , vorausgesetzt, F hat tatsächlich eine Erwartung. (Nicht alle Verteilungen tun dies.) Dies impliziert, dass die Abweichung m ( X 1 , X 2 , … , X n ) - μ ( F ) (die in Abhängigkeit von diesen n Zufallsvariablen auch eine Zufallsvariable ist) dazu neigt kleiner werden als nF.μ ( F.)F.m ( X.1, X.2, … , X.n) - μ ( F.)nnerhöht sich. Das CLT fügt dies auf eine viel spezifischere Weise hinzu: Es besagt (unter einigen Bedingungen, die ich unten diskutieren werde), dass, wenn wir diese Abweichung um , es wird eine VerteilungsfunktionFn haben, die sicheinerNormalverteilungsfunktion mit dem Mittelwert Nullnähert,wennngroß wird. (Meine Antwort unterhttps://stats.stackexchange.com/a/3904versucht zu erklären, warum dies so ist und warum der Faktor √n- -- -√F.nn ist das richtige.)n- -- -√
Dies ist keine Standardanweisung des CLT. Verbinden wir es mit dem üblichen. Diese begrenzende Normalverteilung mit dem Mittelwert Null wird vollständig durch einen zweiten Parameter bestimmt, der normalerweise als Maß für seine Streuung (natürlich!) Ausgewählt wird, wie z. B. seine Varianz oder Standardabweichung. Sei seine Varianz. Sicherlich muss es eine Beziehung zu einer ähnlichen Eigenschaft von F haben . Um herauszufinden , was dies sein könnte, lasse F eine Varianz τ 2 haben, die übrigens unendlich sein könnte. Unabhängig davon, da die X i unabhängig sind, berechnen wir leicht die Varianz der Mittelwerte:σ2F.F.τ2X.ich
Var(m(X1,X2,…,Xn))=Var(1n(X1+X2+⋯+Xn))=(1n)2(Var(X1)+Var(X2)+⋯+Var(Xn))=(1n)2(τ2+τ2+⋯+τ2)=τ2n.
Folglich ist die Varianz der standardisierten Residuen gleich :es ist konstant. Die Varianz der begrenzenden Normalverteilung muss also selbstτ2sein. (Dies zeigt sofort, dass der Satz nur gelten kann, wennτ2endlich ist: das ist die zusätzliche Annahme, die ich zuvor beschönigt habe.)τ2/n×(n−−√)2=τ2τ2τ2
(Wenn wir ein anderes Maß für die Ausbreitung von uns immer noch gelungen, es mit σ 2 zu verbinden , aber wir hätten nicht festgestellt, dass das entsprechende Maß für die Ausbreitung der standardisierten mittleren Abweichung für alle n konstant ist , was sehr schön ist - wenn auch unwesentlich - Vereinfachung.)Fσ2n
Wenn wir es uns gewünscht hätten, hätten wir die mittleren Abweichungen die ganze Zeit standardisieren können, indem wir sie durch dividiert und mit √ multipliziert hättenτ . Dies hätte sichergestellt, dass die GrenzverteilungStandardnormalmit Einheitsvarianz ist. Ob Sie sich dafür entscheiden,auf diese Weisedurchτzu standardisierenoder nicht, ist wirklich Geschmackssache: Es ist der gleiche Satz und am Ende die gleiche Schlussfolgerung. Was zählte, war die Multiplikation mit √n−−√τ .n−−√
Beachten Sie, dass Sie die Abweichungen mit einem anderen Faktor als √ multiplizieren können . Sie könnten √ verwendenn−−√, odern 1 / 2 + 1 / n , oder irgendetwas anderesdass asymptotisch verhält sich wie √n−−√+exp(−n)n1/2+1/nn−−√σ20∞
F.n−- -√F.
F.n- -- -√