Warum verringert das Erhöhen der Stichprobengröße die (Stichproben-) Varianz?


35

Großes Bild:

Ich versuche zu verstehen, wie das Erhöhen der Stichprobengröße die Leistung eines Experiments erhöht. Die Folien meines Dozenten erläutern dies mit einem Bild von 2 Normalverteilungen, eine für die Nullhypothese und eine für die Alternativhypothese und einer Entscheidungsschwelle c dazwischen. Sie argumentieren, dass eine zunehmende Stichprobengröße die Varianz verringert und dadurch eine höhere Kurtosis verursacht, wodurch der gemeinsame Bereich unter den Kurven und damit die Wahrscheinlichkeit eines Fehlers vom Typ II verringert wird.

Kleines Bild:

Ich verstehe nicht, wie eine größere Stichprobe die Varianz verringert.
Ich gehe davon aus, dass Sie nur die Stichprobenvarianz berechnen und als Parameter in einer Normalverteilung verwenden.

Ich habe es versucht:

  • googeln , aber die meisten akzeptierten Antworten haben 0 positive Stimmen oder sind nur Beispiele
  • Denken : Nach dem Gesetz der großen Zahlen sollte sich jeder Wert nach der von uns angenommenen Normalverteilung irgendwann um seinen wahrscheinlichen Wert stabilisieren. Und die Varianz sollte daher zur Varianz unserer angenommenen Normalverteilung konvergieren. Aber was ist die Varianz dieser Normalverteilung und ist sie ein Mindestwert, dh können wir sicher sein, dass unsere Stichprobenvarianz auf diesen Wert abfällt ?

Ihr Gedankenexperiment betraf normalverteilte Daten, aber es gilt auch für Daten, die aus vielen anderen Distributionen stammen (wie von @Aksakal festgestellt, nicht alle! Der Cauchy ist ein häufig zitiertes Beispiel für ein solches schlechtes Verhalten). Für Binomialdaten gibt es eine gute Diskussion darüber, wie Leistung und Standardfehler mit der Stichprobengröße variieren, unter stats.stackexchange.com/q/87730/22228
Silverfish

1
Lassen Sie mich darauf hinweisen, dass Sie, wenn Sie eine Ihrer Meinung nach zufriedenstellende Antwort erhalten haben, diese als "akzeptiert" markieren sollten, indem Sie auf ein grünes Häkchen links daneben klicken. Dies gibt dem Antwortenden eine zusätzliche Reputation und markiert die Frage als gelöst.
Amöbe sagt Reinstate Monica

Ich denke darüber nach: Jeder neue Punkt hat eine einzigartige Information. Unendliche Punkte haben genug, um eine perfekte Schätzung vorzunehmen. Wenn wir immer mehr neue Stichprobenpunkte hinzufügen, wird der Unterschied zwischen den Informationen, die wir für eine perfekte Schätzung benötigen, und den Informationen, die wir tatsächlich haben, immer kleiner.
EngrStudent - Wiedereinsetzung von Monica

Dies ist die Quelle der Verwirrung: Es ist nicht die Stichprobenvarianz, die abnimmt, sondern die Varianz der Stichprobenvarianz. Die Stichprobenvarianz ist ein Schätzer (daher eine Zufallsvariable). Wenn Ihre Daten von einem normalen N (0, 5) stammen, liegt die Stichprobenvarianz nahe bei 5. Wie nahe? Hängt von der Varianz Ihres Schätzers für die Stichprobenvarianz ab. Mit 100 Datenpunkten finden Sie möglicherweise so etwas wie 4.92. Bei 1000 finden Sie so etwas wie 4,98. Mit 10000 finden Sie 5.0001. Die Genauigkeit Ihrer Messungen nimmt also zu, nicht Ihre Messungen selbst.
Ant

Antworten:


32

Die Standardabweichungen der Durchschnittswerte sind kleiner als die Standardabweichungen der einzelnen Beobachtungen. [Ich gehe hier von unabhängigen, identisch verteilten Beobachtungen mit endlicher Populationsvarianz aus; Ähnliches kann gesagt werden, wenn man die ersten beiden Bedingungen entspannt.]

Dies ist eine Folge der einfachen Tatsache, dass die Standardabweichung der Summe zweier Zufallsvariablen kleiner ist als die Summe der Standardabweichungen (sie kann nur gleich sein, wenn die beiden Variablen perfekt korreliert sind).

Wenn es sich um nicht korrelierte Zufallsvariablen handelt, können wir etwas Spezifischeres sagen: Die Varianz einer Variablensumme ist die Summe ihrer Varianzen.

Dies bedeutet, dass bei unabhängigen (oder auch nur unkorrelierten) Variationen mit derselben Verteilung die Varianz des Mittelwerts die Varianz eines Individuums dividiert durch die Stichprobengröße ist .n

Entsprechend ist bei unabhängigen (oder auch nur unkorrelierten) Variationen mit derselben Verteilung die Standardabweichung ihres Mittelwerts die Standardabweichung eines Individuums dividiert durch die Quadratwurzel des Stichprobenumfangs:n

σX¯=σ/n .

Wenn Sie also mehr Daten hinzufügen, erhalten Sie immer genauere Schätzungen der Gruppenmittelwerte. Ein ähnlicher Effekt tritt bei Regressionsproblemen auf.

Da wir durch Erhöhen des Stichprobenumfangs genauere Schätzungen von Durchschnitten erhalten, können wir Mittelwerte, die nahe beieinander liegen, leichter unterscheiden - auch wenn sich die Verteilungen ein wenig überlappen, indem wir einen großen Stichprobenumfang nehmen, können wir sie dennoch schätzen Bevölkerung bedeutet genau genug, um zu sagen, dass sie nicht gleich sind.


8

Die Variabilität, die schrumpft, wenn N zunimmt, ist die Variabilität des Stichprobenmittelwerts, die häufig als Standardfehler ausgedrückt wird. Oder anders ausgedrückt, die Sicherheit der Richtigkeit des Stichprobenmittelwerts nimmt zu.

Stellen Sie sich vor, Sie führen ein Experiment durch, bei dem Sie 3 Männer und 3 Frauen sammeln und ihre Höhe messen. Wie sicher sind Sie, dass die Durchschnittshöhen jeder Gruppe die wahren Durchschnittswerte der unterschiedlichen Bevölkerungsgruppen von Männern und Frauen sind? Ich sollte denken, dass Sie überhaupt nicht sehr sicher wären. Sie könnten leicht neue Proben von 3 sammeln und mehrere Zentimeter von den ersten neue Mittelwerte finden. Nicht wenige dieser wiederholten Experimente könnten sogar dazu führen, dass Frauen größer als Männer sind, da die Mittel so unterschiedlich wären. Mit einem niedrigen N haben Sie nicht viel Gewissheit über den Mittelwert der Stichprobe und dieser variiert stark zwischen den Stichproben.

Stellen Sie sich nun 10.000 Beobachtungen in jeder Gruppe vor. Es wird ziemlich schwierig sein, neue Proben von 10.000 zu finden, deren Mittelwerte sich stark voneinander unterscheiden. Sie sind viel weniger variabel und Sie sind sich ihrer Genauigkeit sicherer.

σn

Hier ist eine kleine Simulation in R, um die Beziehung zwischen einem Standardfehler und der Standardabweichung des Mittels vieler vieler Replikationen des anfänglichen Experiments zu demonstrieren. In diesem Fall beginnen wir mit einem Populationsmittel von 100 und einer Standardabweichung von 15.

mu <- 100
s <- 50
n <- 5
nsim <- 10000 # number of simulations
# theoretical standard error
s / sqrt(n)
# simulation of experiment and the standard deviations of their means
y <- replicate( nsim, mean( rnorm(n, mu, s) ) )
sd(y)

Beachten Sie, dass die endgültige Standardabweichung in der Nähe des theoretischen Standardfehlers liegt. Wenn Sie hier mit der Variablen n spielen, können Sie sehen, dass das Variabilitätsmaß mit zunehmendem Wert von n kleiner wird.

[Abgesehen davon ändert sich die Kurtosis in den Diagrammen nicht wirklich (vorausgesetzt, es handelt sich um Normalverteilungen). Durch Verringern der Varianz wird die Kurtosis nicht verändert, aber die Verteilung wird enger. Die einzige Möglichkeit, die Veränderungen der Kurtosis visuell zu untersuchen, besteht darin, die Verteilungen auf die gleiche Skala zu bringen.]


du
hattest

Zwei Dinge sind nicht ganz klar: (1) Sind die Glockenkurven, von denen OP spricht, Verteilungen von Stichprobenmitteln? (2) Werden die Probengrößen sowohl für die Verteilung des Mittelwerts der Kontrollgruppenproben als auch für die Verteilung des Mittelwerts der Versuchsgruppenproben berücksichtigt?
Lenar Hoyt

4

Wenn Sie wissen wollen, wie viel amerikanische Staatsbürger durchschnittlich wiegen, bitten Sie im Idealfall jeden Staatsbürger, sofort auf die Waage zu treten und die Daten zu sammeln. Sie würden eine genaue Antwort bekommen. Das ist sehr schwierig. Vielleicht können Sie ein paar Bürger dazu bringen, die Waage zu betreten, den Durchschnitt zu berechnen und eine Vorstellung davon zu bekommen, wie hoch der Durchschnitt der Bevölkerung ist. Würden Sie erwarten, dass der Stichprobendurchschnitt genau dem Bevölkerungsdurchschnitt entspricht? Ich hoffe nicht.

Würden Sie zustimmen, dass wir uns irgendwann der Bevölkerungszahl nähern würden, wenn Sie mehr und mehr Menschen hätten? Wir sollten, richtig? Am Ende können wir höchstens die gesamte Bevölkerung erreichen, und das Mittel ist das, wonach wir suchen. Das ist die Intuition.

Dies war ein idealisiertes Gedankenexperiment. In Wirklichkeit gibt es Komplikationen. Ich gebe dir zwei.

  • Stellen Sie sich vor, die Daten stammen aus einer Cauchy-Distribution . Sie können Ihre Stichprobe unbegrenzt erhöhen, die Varianz nimmt jedoch nicht ab. Diese Verteilung weist keine Populationsvarianz auf. Genau genommen hat es auch keinen Stichprobenmittelwert. Es ist traurig. Erstaunlicherweise ist diese Verteilung ziemlich real, sie taucht hier und da in der Physik auf.
  • Stellen Sie sich vor, Sie haben sich entschlossen, das Durchschnittsgewicht der amerikanischen Staatsbürger zu bestimmen. Also nimmst du deine Waage und gehst von Haus zu Haus. Dies wird Sie viele, viele Jahre in Anspruch nehmen. Bis Sie Millionen von Beobachtungen gesammelt haben, haben einige der Bürger in Ihrem Datensatz ihr Gewicht stark geändert, einige sind gestorben usw. Der Punkt ist, dass eine Vergrößerung der Stichprobe in diesem Fall nicht hilfreich ist.

1
Ich vermute, Sie meinten in Ihrem ersten Satz "durchschnittliches Gewicht". Ich mag die Verwendung eines Gedankenexperiments. Eine weitere Komplikation kann von Ihrem Messgerät ausgehen - dh die Waage, die sich abnutzt, weist möglicherweise einen Parallaxenfehler oder einen Benutzerfehler auf, der eine andere Variabilität mit sich bringt.
MarkR

1

Ich glaube, dass das Gesetz der großen Zahlen erklärt, warum die Varianz (Standardfehler) abnimmt, wenn die Stichprobengröße zunimmt. Der Wikipedia-Artikel dazu lautet:

Nach dem Gesetz sollte der Durchschnitt der Ergebnisse einer großen Anzahl von Versuchen nahe am erwarteten Wert liegen und wird sich mit zunehmender Anzahl von Versuchen tendenziell annähern.

In Bezug auf den zentralen Grenzwertsatz:

Wenn Sie eine einzelne Zufallsstichprobe ziehen, ist der Mittelwert der Stichprobe umso näher am Mittelwert der Grundgesamtheit (im obigen Zitat stellen Sie sich "Anzahl der Versuche" als "Stichprobengröße" vor, sodass jeder "Versuch" eine Beobachtung ist ). Daher ist beim Zeichnen einer unendlichen Anzahl von Zufallsstichproben die Varianz der Stichprobenverteilung umso geringer, je größer die Größe jeder Stichprobe ist.

Mit anderen Worten, die Glockenform wird enger, wenn jede Probe groß statt klein ist, da auf diese Weise jeder Probenmittelwert näher an der Mitte der Glocke liegt.


0

Mit zunehmender Stichprobengröße nimmt die Stichprobenvarianz (Variation zwischen Beobachtungen) zu, die Varianz des Stichprobenmittelwerts (Standardfehler) nimmt jedoch ab und damit die Genauigkeit.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.