ist die Populationsgröße und n ist die Stichprobengröße. Die Frage lautet, warum die Populationsvarianz die Abweichung des mittleren Quadrats vom Mittelwert ist und nicht das ( N - 1 ) / N = 1 - ( 1 / N ) -fache. Warum eigentlich dort aufhören? Warum multiplizieren Sie nicht zum Beispiel die mittlere quadratische Abweichung mit 1 - 2 / N oder 1 - 17 / N oder exp ( - 1 / N ) ?Nn( N- 1 ) / N= 1 - ( 1 / N)1 - 2 / N1 - 17 / Nexp( - 1 / N)
Es gibt tatsächlich einen guten Grund, dies nicht zu tun. Jede dieser Zahlen, die ich gerade erwähnte, wäre eine gute Möglichkeit, eine "typische Ausbreitung" innerhalb der Bevölkerung zu quantifizieren. Ohne vorherige Kenntnis der Populationsgröße wäre es jedoch unmöglich, eine Zufallsstichprobe zu verwenden, um einen unverzerrten Schätzer für eine solche Zahl zu finden. Wir wissen, dass die Stichprobenvarianz , die die mittlere quadratische Abweichung vom Stichprobenmittelwert mit multipliziert , ein unverzerrter Schätzer für die übliche Populationsvarianz bei Stichproben mit Ersatz ist. (Es gibt kein Problem mit dieser Korrektur, da wir n kennen !) Die Stichprobenvarianz wäre daher voreingenommen( n - 1 ) / nnSchätzer eines Vielfachen der Populationsvarianz, wobei dieses Vielfache, wie , vorher nicht genau bekannt ist.1 - 1 / N
Dieses Problem einer unbekannten Verzerrung würde sich auf alle statistischen Tests ausbreiten, die die Stichprobenvarianz verwenden, einschließlich T-Tests und F-Tests. Tatsächlich würde eine Division durch irgendetwas anderes als in der Populationsvarianzformel erfordern, dass wir alle statistischen Tabellen von t-Statistiken und F-Statistiken (und viele andere Tabellen auch) ändern, aber die Anpassung würde von der Populationsgröße abhängen. Niemand möchte Tische für jedes mögliche N machen müssen ! Besonders wenn es nicht nötig ist.NN
NN- 1NMachen Sie sich nicht einmal die Mühe, den Unterschied zu lehren: Sie stellen einfach eine einzige Varianzformel bereit (dividieren durch oder n, je nachdem, was der Fall ist).Nn