Mit Sicherheit kann der Mittelwert plus eins sd die größte Beobachtung übertreffen.
Betrachten Sie die Probe 1, 5, 5, 5 -
es hat Mittelwert 4 und Standardabweichung 2, also ist der Mittelwert + sd 6, einer mehr als das Stichprobenmaximum. Hier ist die Berechnung in R:
> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6
Es ist ein weit verbreitetes Ereignis. Dies tritt in der Regel auf, wenn ein Haufen hoher Werte und ein Nachlassen nach links zu verzeichnen sind (dh wenn eine starke linke Schräglage und ein Peak in der Nähe des Maximums vorliegen).
-
Die gleiche Möglichkeit gilt für Wahrscheinlichkeitsverteilungen, nicht nur für Stichproben - der Populationsmittelwert plus die Population sd können den maximal möglichen Wert leicht überschreiten.
Hier ist ein Beispiel für eine Dichte von mit einem maximal möglichen Wert von 1:Beta ( 10 , 12)
In diesem Fall können wir auf der Wikipedia-Seite nach der Beta-Distribution suchen, die besagt, dass der Mittelwert ist:
E[ X] = αα + β
und die Varianz ist:
var[ X] = & Agr; & bgr;( α + β)2( α + β+ 1 )
(Obwohl wir uns nicht auf Wikipedia verlassen müssen, da sie ziemlich einfach abzuleiten sind.)
Für und wir also einen Mittelwert von und sd , also einen Mittelwert von + sd , mehr als das mögliche Maximum von 1.β = 1α = 10 ≈0,9523≈0,0628≈1,0152β= 12≈ 0,9523≈ 0,0628≈ 1,0152
Das heißt, es ist leicht möglich, einen Wert von mean + sd zu haben, der nicht als Datenwert beobachtet werden kann .
-
In jeder Situation, in der der Modus maximal war, muss die Pearson-Modus-Schiefe nur damit der Mittelwert + sd den Maximalwert überschreitet. Es kann jeden Wert annehmen, positiv oder negativ, so dass wir sehen können, dass es leicht möglich ist.<- 1
-
Ein eng verwandtes Problem treten häufig bei Konfidenzintervallen für ein Binomialverhältnis auf , wobei ein häufig verwendetes Intervall, das normale Approximationsintervall , Grenzwerte außerhalb von erzeugen kann .[ 0 , 1 ]
Betrachten Sie beispielsweise ein normales Annäherungsintervall von 95,4% für den Bevölkerungsanteil der Erfolge in Bernoulli-Studien (Ergebnisse sind 1 oder 0, was Erfolgs- und Misserfolgsereignisse darstellt), wobei 3 von 4 Beobachtungen " " und eine Beobachtung " " sind.010
Dann ist die Obergrenze für das Intervallp^+ 2 × 14p^( 1 - p^)---------√= p^+ p^( 1 - p^)-------√= 0,75 + 0,433 = 1,183
Dies ist nur der Stichprobenmittelwert + die übliche Schätzung des SD für das Binomial ... und ergibt einen unmöglichen Wert.
Die übliche Stichprobe sd für 0,1,1,1 ist 0,5 statt 0,433 (sie unterscheiden sich, weil die binomiale ML-Schätzung der Standardabweichung der Division der Varianz durch und nicht durch ). Aber es macht keinen Unterschied - in beiden Fällen übersteigt der Mittelwert + sd den größtmöglichen Anteil.p^( 1 - p^)nn - 1
Diese Tatsache, dass ein normales Approximationsintervall für das Binom "unmögliche Werte" erzeugen kann, wird häufig in Büchern und Aufsätzen vermerkt. Sie haben es jedoch nicht mit Binomialdaten zu tun. Trotzdem ist das Problem - das heißt, + eine Anzahl von Standardabweichungen ist kein möglicher Wert - analog.
-
In Ihrem Fall führt der ungewöhnliche Wert "0" in Ihrer Stichprobe dazu, dass der sd größer wird als der Mittelwert nach unten, weshalb der Mittelwert + sd hoch ist.
-
(Die Frage wäre stattdessen - aus welchen Gründen wäre es unmöglich? -, denn ohne zu wissen, warum jemand das Gefühl hat, es gäbe überhaupt ein Problem. Woran wenden wir uns?)
Logischerweise zeigt man, dass es möglich ist, indem man ein Beispiel gibt, wo es passiert. Das hast du schon getan. Was müssen Sie tun, wenn kein Grund angegeben ist, warum dies anders sein sollte?
Wenn ein Beispiel nicht ausreicht, welcher Beweis wäre akzeptabel?
Es hat wirklich keinen Sinn, einfach auf eine Aussage in einem Buch zu verweisen, da jedes Buch eine fehlerhafte Aussage machen kann - ich sehe sie die ganze Zeit. Man muss sich auf die direkte Demonstration verlassen, dass es möglich ist, entweder einen algebraischen Beweis (man könnte ihn aus dem obigen Beta-Beispiel * konstruieren) oder ein numerisches Beispiel (das Sie bereits angegeben haben), das jeder selbst überprüfen kann .
* whuber gibt die genauen Bedingungen für den Beta-Fall in Kommentaren an.