Mir wurde immer beigebracht, dass die CLT funktioniert, wenn Sie die Probenahme wiederholt haben, wobei jede Probe groß genug ist. Stellen Sie sich zum Beispiel vor, ich habe ein Land mit 1.000.000 Einwohnern. Mein Verständnis von CLT ist, dass selbst wenn die Verteilung ihrer Höhen nicht normal war, wenn ich 1000 Proben von 50 Personen nahm (dh 1000 Umfragen mit jeweils 50 Bürgern durchführte), dann ihre mittlere Größe für jede Probe berechnet wurde, die Verteilung dieser Stichprobe Mittel wäre normal.
Ich habe jedoch noch nie einen Fall aus der Praxis gesehen, in dem Forscher wiederholt Proben entnommen haben. Stattdessen nehmen sie eine große Stichprobe (dh befragen 50.000 Bürger über ihre Größe) und arbeiten daraus.
Warum lehren Statistikbücher wiederholte Stichproben und in der realen Welt führen Forscher nur eine einzige Stichprobe durch?
Bearbeiten: Der reale Fall, über den ich nachdenke, besteht darin, Statistiken über einen Datensatz von 50.000 Twitter-Benutzern zu erstellen. Dieser Datensatz ist offensichtlich keine wiederholte Stichprobe, sondern nur eine große Stichprobe von 50.000.