Verwenden Sie die Definitionen des Mittelwerts
μ1:n=1n∑i=1nxi
und Stichprobenvarianz
σ21:n=1n∑i=1n(xi−μ1:n)2=n−1n(1n−1∑i=1n(xi−μ1:n)2)
(das letzte Glied in den Klammern ist der unvoreingenommene Varianzschätzer standardmäßig berechnet häufig in statistischer Software) auf die Summe der Quadrate findet alle Daten . Ordnen wir die Indizes i so an, dass i = 1 , … , n Elemente der ersten Gruppe und i = n + 1 , … , n + m Elemente der zweiten Gruppe bezeichnen. Teilen Sie die Summe der Quadrate nach Gruppen auf und drücken Sie die beiden Teile anhand der Varianzen und Mittelwerte der Teilmengen der Daten erneut aus:xiii=1,…,ni=n+1,…,n+m
(m+n)(σ21:m+n+μ21:m+n)=∑i=11:n+mx2i=∑i=1nx2i+∑i=n+1n+mx2i=n(σ21:n+μ21:n)+m(σ21+n:m+n+μ21+n:m+n).
Eine algebraische Lösung für in Bezug auf die anderen (bekannten) Größen ergibtσ2m+n
σ21:m+n=n(σ21:n+μ21:n)+m(σ21+n:m+n+μ21+n:m+n)m+n−μ21:m+n.
Natürlich kann unter Verwendung des gleichen Ansatzes auch als Gruppenmittel ausgedrückt werden.μ1:m+n=(nμ1:n+mμ1+n:m+n)/(m+n)
Ein anonymer Teilnehmer weist darauf hin, dass die Lösung für σ 2 m + n ein gewichtetes Mittel von ist , wenn die Stichprobenmittelwerte gleich sind (so dass ) die Gruppenstichprobenvarianzen.μ1:n=μ1+n:m+n=μ1:m+nσ2m+n