Ich versuche, Statistiken zu lernen, weil ich feststelle, dass sie so verbreitet sind, dass ich einige Dinge nicht lernen kann, wenn ich sie nicht richtig verstehe. Ich habe Probleme, diesen Begriff einer Stichprobenverteilung der Stichprobenmittel zu verstehen. Ich kann nicht verstehen, wie es einige Bücher und Websites erklärt haben. Ich glaube, ich habe Verständnis, bin mir aber nicht sicher, ob es korrekt ist. Unten ist mein Versuch, es zu verstehen.
Wenn wir über ein Phänomen sprechen, das eine Normalverteilung annimmt, betrifft dies im Allgemeinen (nicht immer) die Bevölkerung.
Wir möchten Inferenzstatistiken verwenden, um einige Informationen über eine bestimmte Population vorherzusagen, haben aber nicht alle Daten. Wir verwenden Zufallsstichproben und es ist ebenso wahrscheinlich, dass jede Stichprobe der Größe n ausgewählt wird.
Wir nehmen also viele Stichproben, sagen wir 100, und dann ist die Verteilung der Mittelwerte dieser Stichproben gemäß dem zentralen Grenzwertsatz ungefähr normal. Der Mittelwert der Stichprobenmittelwerte entspricht in etwa dem Bevölkerungsmittelwert.
Was ich nicht verstehe, ist, dass Sie häufig "Eine Stichprobe von 100 Personen ..." sehen. Brauchen wir nicht 10 oder 100 Stichproben von 100 Personen, um die Bevölkerung des Mittelwerts zu schätzen? Oder ist es der Fall, dass wir eine einzige Stichprobe nehmen können, die groß genug ist, sagen wir 1000, und dann sagen wir, dass der Mittelwert sich dem Mittelwert der Grundgesamtheit annähert? ODER nehmen wir eine Stichprobe von 1000 Personen und dann 100 zufällige Stichproben von 100 Personen in jeder Stichprobe von den ursprünglich 1000 Personen, die wir genommen haben, und verwenden diese dann als unsere Annäherung?
Funktioniert es immer, eine ausreichend große Stichprobe zu nehmen, um sich dem Mittelwert (fast) anzunähern? Muss die Bevölkerung überhaupt normal sein, damit dies funktioniert?