Sind alle 20 Probanden gleich groß, wenn die Standardabweichung der Probe mit 0,0 angegeben wird?


8

Die Studie, die ich überprüfe, berichtet über eine mittlere Körpergröße von 20 Probanden von 1,70 Metern mit einer Standardabweichung von 0,0. Bedeutet das, dass alle 20 genau 1,70 Meter sind? Oder ist dies ein Meldefehler?

Antworten:


16

Gemäß diesem Biologie-SE-Faden beträgt die Standardabweichung der männlichen Erwachsenengröße etwa Meter und der weiblichen etwa Meter.0,060.070.06

Eine Rundung auf eine Dezimalstelle würde Meter ergeben. Die Tatsache, dass die Standardabweichung als Meter angegeben wird, zeigt eine Standardabweichung unter Metern an ... aber eine Standardabweichung von beispielsweise Metern würde immer noch mit der angegebenen Zahl übereinstimmen, da sie auf runden würde, jedoch a anzeigen würde Höhenunterschiede in der Stichprobe sind nur geringfügig geringer als die täglich in der Allgemeinbevölkerung beobachteten Schwankungen.0,0 0,05 0,048 0,00.10.00.050.0480.0

Ist die Zahl gut berichtet? Nun, es wäre weitaus nützlicher, wenn die Standardabweichung als Mittelwert auf zwei Dezimalstellen angegeben worden wäre. Es kann sich auch um einen einfachen numerischen oder Rundungsfehler handeln. zum Beispiel haben könnte abgeschnitten auf anstatt abgerundet . Aber könnte es möglich sein, dass sich die Abbildung stattdessen auf den Standardfehler bezieht? Ich sehe oft Zahlen, die so geschrieben sind, dass es nicht eindeutig ist, ob eine Standardabweichung oder ein Standardfehler angegeben wird - zum Beispiel "der Stichprobenmittelwert ist ".0,0 1,62 ( ± 0,06 )0.070.01.62(±0.06)


Wie plausibel ist es, wenn die richtige Standardabweichung auf auf eine Dezimalstelle gerundet wird ? Der folgende R-Code simuliert eine Million Stichproben der Größe 20 aus einer Population mit einer Standardabweichung von (wie an anderer Stelle für die weibliche Größe angegeben), ermittelt die Standardabweichung für jede Stichprobe, zeichnet ein Histogramm der Ergebnisse auf und berechnet den Anteil von Proben, bei denen die beobachtete Standardabweichung unter :0,06 0,050.00.060.05

set.seed(123) #so uses same random numbers each time code is run
x <- replicate(1e6, sd(rnorm(20, sd=0.06)))
hist(x)
sum(x < 0.05)/1e6

[1] 0.170691

Histogramm der Standardabweichungen der Stichprobe

Daher ist eine Standardabweichung, die auf rundet, nicht unplausibel und tritt in etwa siebzehn Prozent der Fälle auf, wenn die Höhen normalerweise mit der tatsächlichen Standardabweichung .0,060.00.06

Vorbehaltlich dieser Annahmen können wir diese Wahrscheinlichkeit auch wie folgt mit ungefähr siebzehn Prozent berechnen, anstatt sie zu simulieren:

P(S2<0.052)=P(19S20.062<19×0.0520.062)=P(19S20.062<13.194)=0.1715

wo wir die Tatsache verwendet haben, dass der Chi-Quadrat-Verteilung mit Grad folgt der Freiheit. Sie können die Wahrscheinlichkeit in R mit berechnen ; Wenn Sie durch veröffentlichten Zahlen für männliche Standardabweichungen ersetzen , verringert sich die Wahrscheinlichkeit auf etwa vier Prozent. Wie @whuber in den Kommentaren unten ausführt, ist es wahrscheinlicher, dass diese Art von kleinen "Runden auf Null" SD auftritt, wenn die Stichprobe homogener war als die allgemeine Bevölkerung. Wenn die Populationsstandardabweichung etwa beträgt n - 1 = 19 0,06 0,07 0,06(n1)S2/σ2=19S2/0.062n1=19pchisq(q = 19*0.05^2/0.06^2, df = 19)0.060.070.06 Meter, dann wäre die Wahrscheinlichkeit, eine so kleine Standardabweichung der Stichprobe zu erhalten, ebenfalls gesunken, wenn die Stichprobengröße größer gewesen wäre.

curve(pchisq(q = 19*0.05^2/x^2, df = 19), from=0.005, to=0.1,
      xlab="Population SD", ylab="Probability sample SD < 0.05 if n = 20")

Die Wahrscheinlichkeit einer niedrigen Stichproben-SD sinkt, wenn die Populations-SD zunimmt

curve(pchisq(q = (x-1)*0.05^2/0.06^2, df = x-1), from=2, to=50, ylim=c(0,0.6),
      xlab="Sample size", ylab="Probability sample SD < 0.05 if population SD = 0.06")

Die Wahrscheinlichkeit einer niedrigen Proben-SD sinkt, wenn die Probengröße steigt


5
+1. Es ist auch plausibel, dass es sich bei der Studie beispielsweise um eine Gruppe von Personen aus einer homogenen Bevölkerung handelte, z. B. eine Sportmannschaft, eine Cheerleadergruppe usw. In diesem Fall hätte der SD sehr gut 0,01 m oder weniger betragen können.
whuber

@whuber Netter Punkt! Ich fragte mich, wie plausibel es für den SD sein könnte, auf 0,00 zu runden (dh weniger als 0,005), und war überrascht, wie eng die Bedingungen dafür tatsächlich sind. Wahrscheinlich hätte es nicht sein sollen, da es wirklich auf die Verhältnisstornierung hinausläuft. Wenn Cheerleader beispielsweise eine Population von SD = 0,01 haben, pchisq(q = 19*0.005^2/0.01^2, df = 19)ergibt sich nur eine Wahrscheinlichkeit von 0,04% für eine Probe SD <0,005. Selbst die Population SD = 0,008 ergibt eine Wahrscheinlichkeit von nur etwa 0,8%. Aber Populations-SDs von 0,007, 0,006 und 0,005 ergeben Wahrscheinlichkeiten von 4%, 17% (kein Zufall!) Und 54%
Silverfish

3
Ich kann mir einige Möglichkeiten vorstellen, um sehr wenig Variation zu bekommen. Stellen Sie sich einen Zustand vor, der eine minimale oder maximale Höhe vorschreibt - z. B. haben in der Vergangenheit viele Armeen ein Höchstmaß für die Besatzung ihrer Panzer festgelegt, oder einige Orte hatten ein Mindestmaß für die Polizei. Wenn wir den größten Besatzungsmitglied in jedem Panzerzug nehmen (unter Berücksichtigung einer typischen historischen Regel für die maximale Höhe, die normalerweise weit unter der durchschnittlichen Höhe liegt) und die Standardabweichung der Stichproben ihrer Höhen ermitteln, ist diese tendenziell sehr klein, da diese Höhen tendenziell sind gegen die Grenze eingeklemmt werden.
Glen_b -Reinstate Monica

Da in der Frage keine Sprache oder kein Werkzeug angegeben wurde, bedeutet 0.0 nicht unbedingt, dass auf eine Dezimalstelle gerundet oder abgeschnitten wird. 0.0 kann nur sein, wie die betreffende Sprache 0 als Dezimal- / Gleitkommazahl anzeigt (was einige Sprachen tun).
NotThatGuy

2

Es handelt sich mit ziemlicher Sicherheit um einen Meldefehler, es sei denn, die Personen wurden für diese Größe ausgewählt.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.