Dies ist eine ausgezeichnete Frage, da sie zeigt, dass Sie über die intuitiven Aspekte der Theoreme nachdenken, die Sie lernen. Damit sind Sie den meisten Schülern, die das CLT lernen, voraus. Hier werde ich versuchen, Ihnen eine Erklärung zu geben, wie es dem CLT möglich ist, Zufallsvariablen mit eingeschränkter Unterstützung zu halten.
Der klassische zentrale Grenzwertsatz gilt für jede Folge die aus unabhängigen und identisch verteilten Zufallsvariablen mit beliebigem Mittelwert und endlich besteht Nicht-Null-Varianz . Angenommen, Sie haben eine solche Sequenz und sie sind durch , und daher deckt ihre Unterstützung nicht die gesamte reale Linie ab.X1,X2,X3,...∼IID Dist(μ,σ2)μ0<σ2<∞xmin⩽Xi⩽xmax
Der zentrale Grenzwertsatz bezieht sich auf die Verteilung des Stichprobenmittelwerts und auf die eingeschränkte Unterstützung der zugrunde liegenden Zufallsvariablen in In der Reihenfolge muss diese Statistik auch die Grenzen . Die Darstellung verdickt sich also - der Stichprobenmittelwert, der Gegenstand des Satzes ist, ist ebenfalls begrenzt! Wie kann das CLT halten, wenn dies der Fall ist?X¯n≡1n∑ni=1Xixmin⩽X¯n⩽xmax
Zentraler Grenzwertsatz (CLT): Wenn die Standardnormalverteilungsfunktion ist, haben wir:Φ
limn→∞P(X¯n−μσ/n−−√⩽z)=Φ(z).
Annäherung aus CLT: Für großes wir die ungefähre Verteilung:n
X¯n∼N(μ,σ2n).
Ihr Problem ergibt sich aus der Tatsache, dass die aus diesem Theorem resultierende Verteilungsnäherung eine Verteilung mit begrenzter Unterstützung durch eine mit unbegrenzter Unterstützung approximiert und daher nicht korrekt sein kann. Sie haben Recht damit - die Verteilungsnäherung für großes ist nur eine Näherung , und sie gibt tatsächlich die Wahrscheinlichkeit falsch an, dass der Stichprobenmittelwert außerhalb seiner Grenzen liegt (indem Sie diese positive Wahrscheinlichkeit angeben).n
Die CLT ist jedoch keine Aussage über eine Verteilungsnäherung für endliches . Es geht um die Grenzverteilung des standardisierten Stichprobenmittelwerts. Die Grenzen dieser Menge sind:n
zmin=xmin−μσ/n−−√⩽X¯n−μσ/n−−√⩽xmax−μσ/n−−√=zmax.
Als wir nun die Grenzen und was bedeutet, dass die Grenzen des standardisierten Stichprobenmittelwerts breiter werden und breiter und konvergieren in der Grenze zur gesamten realen Linie. (Oder, um es etwas formeller auszudrücken, für jeden Punkt in der realen Linie umfassen die Grenzen diesen Punkt für ein ausreichend großes .) Eine Folge davon ist, dass die Wahrscheinlichkeit den Teilen außerhalb der Grenzen durch die Normalen zugeschrieben wird Die Verteilung konvergiert gegen Null als .n→∞zmin→−∞zmax→∞nn→∞
Hier kommen wir zum Kern des Problems bezüglich Ihrer Bedenken bezüglich des CLT. Es ist wahr, dass für jedes endliche eine normale Annäherung an die Verteilung des Stichprobenmittelwerts Teilmengen von Werten, die außerhalb der Grenzen der wahren Unterstützung liegen, eine positive Wahrscheinlichkeit verleiht. Wenn wir jedoch die Grenze konvergiert diese fehlerhafte positive Wahrscheinlichkeit gegen Null. Die Verteilungsnäherung an den standardisierten Stichprobenmittelwert konvergiert gegen die wahre Verteilung dieser Größe im Grenzbereich, obwohl die Näherung nicht genau für endliches .nn→∞n