Für alle Zahlen y 1 , y 2 , … , y N mit dem Mittelwert
ˉ y = 1Ny1,y2,…,yN, die Varianz ist gegeben durch
σ 2y¯=1N∑i=1Nyi
Anwenden von(1)auf die gegebene Menge vonnZahlenx1,x2,…xn,
die wir zur Vereinfachung der Darstellung als Mittelwert vonˉ betrachtenx=0, wir haben
σ2=1
σ2σ2=1N−1∑i=1N(yi−y¯)2=1N−1∑i=1N(y2i−2yiy¯+y¯2)=1N−1[(∑i=1Ny2i)−2N(y¯)2+N(y¯)2]=1N−1∑i=1N(y2i−(y¯)2)(1)
(1)nx1,x2,…xnx¯=0
Wenn wirdiesem Datensatznun eine neue Beobachtung
xn+1hinzufügen, dann ist der neue Mittelwert des Datensatzes
1σ2=1n−1∑i=1n(x2i−(x¯)2)=1n−1∑i=1nx2i
xn+1 ,
während die neue Varianz
σ 21n+1∑i=1n+1xi=nx¯+xn+1n+1=xn+1n+1
Also
| xn+1| muss größer als
σ√ seinσ^2=1n∑i=1n+1(x2i−x2n+1(n+1)2)=1n[((n−1)σ2+x2n+1)−x2n+1n+1]=1n[(n−1)σ2+nn+1x2n+1]>σ2 only if x2n+1>n+1nσ2.
|xn+1|
oder allgemeiner
gesagtxn+1muss sich vom Mittelwert mean
xdes ursprünglichen Datensatzes um mehr als
σ√ unterscheidenσ1+1n−−−−−√xn+1x¯ , damit der erweiterte Datensatz eine größere Varianz aufweist als der ursprüngliche Datensatz. Siehe auch die Antwort von Ray Koopman, in der darauf hingewiesen wird, dass die neue Varianz größer, gleich oder kleiner als die ursprüngliche Varianz gemäß
xn+1 ist und
sich vom Mittelwert um mehr, genau oder weniger als
σ√ unterscheidetσ1+1n−−−−−√xn+1 .
σ1+1n−−−−−√