Beachten Sie, dass der Varianzausdruck in der Frage eine Annäherung ist. Hedges (1981) leitete die große Stichprobenvarianz von und Approximation in einer allgemeinen Umgebung (dh mehrere Experimente / Studien) ab, und meine Antwort geht so ziemlich durch die Ableitungen in der Arbeit.d
Zunächst werden die folgenden Annahmen verwendet:
Nehmen wir an, wir haben zwei unabhängige Behandlungsgruppen, (Behandlung) und C (Kontrolle). Lassen Y T i und Y C j die Werte sein / Antworten / was auch immer von Subjekt i in Gruppe T und Subjekt j in Gruppe C ist.TCYTiYCjiTjC
Wir gehen davon aus, dass die Reaktionen normal verteilt sind und die Behandlungs- und Kontrollgruppen eine gemeinsame Varianz aufweisen, d. H
YTiYCj∼N(μT,σ2),i=1,…nT∼N(μC,σ2),j=1,…nC
Die Effektgröße, die wir in jeder Studie schätzen möchten, ist . Der Schätzer der verwendeten Effektgröße ist
d= ˉ Y T- ˉ Y Cδ=μT−μCσ
wobeiS2kdie unverzerrte Stichprobenvarianz für die Gruppek ist.
d=Y¯T−Y¯C(nT−1)S2T+(nC−1)S2CnT+nC−2−−−−−−−−−−−−−√
S2kk
Betrachten wir die Eigenschaften von für große Stichproben . d
Beachten Sie zunächst, dass:
und (mit meiner Notation locker):
( n T - 1 ) S 2 T
Y¯T−Y¯C∼N(μT−μC,σ2nT+nCnTnC)
und
(nC-1)S 2 C(nT−1)S2Tσ2(nT+nC−2)=1nT+nC−2(nT−1)S2Tσ2∼1nT+nC−2χ2nT−1(1)
(nC−1)S2Cσ2(nT+nC−2)=1nT+nC−2(nC−1)S2Cσ2∼1nT+nC−2χ2nC−1(2)
1σ2(nT−1)S2T+(nC−1)S2CnT+nC−2∼1nT+nC−2χ2nT+nC−2
Now, some clever algebra:
d=Y¯T−Y¯C(nT−1)S2T+(nC−1)S2CnT+nC−2−−−−−−−−−−−−−√=(σnT+nCnTnC−−−−−√)−1(Y¯T−Y¯C)(σnT+nCnTnC−−−−−√)−1(nT−1)S2T+(nC−1)S2CnT+nC−2−−−−−−−−−−−−−√=(Y¯T−Y¯C)−(μT−μC)σnT+nCnTnC√+μT−μCσnT+nCnTnC√(nT+nCnTnC−−−−−√)−1(nT−1)S2T+(nC−1)S2Cσ2(nT+nC−2)−−−−−−−−−−−−−√=nT+nCnTnC−−−−−−−√⎛⎝⎜θ+δnTnCnT+nC−−−−−√Vν−−√⎞⎠⎟
where
θ∼N(0,1),
V∼χ2ν, and
ν=nT+nC−2. Thus,
d is
nT+nCnTnC−−−−−√ times a variable which follows a non-central t-distribution with
nT+nC−2 degrees of freedom and non-centrality parameter of
δnTnCnT+nC−−−−−√.
Using the moment properties of the non-central t distribution, it follows that:
Var(d)=(nT+nC−2)(nT+nC−4)(nT+nC)nTnC(1+δ2nTnCnT+nC)−δ2b2(3)
where
b=Γ(nT+nC−22)nT+nC−22−−−−−−−√Γ(nT+nC−32)≈1−34(nT+nC−2)−1
So Equation (3) provides the exact large sample variance. Note that an unbiased estimator for δ is bd, with variance:
Var(bd)=b2(nT+nC−2)(nT+nC−4)(nT+nC)nTnC(1+δ2nTnCnT+nC)−δ2
For large degrees of freedom (i.e. large nT+nC−2), the variance of a non-central t variate with ν degrees of freedom and non-centrality parameter p can be approximated by 1+p22ν (Johnson, Kotz, Balakrishnan, 1995). Thus, we have:
Var(d)≈nT+nCnTnC⎛⎝⎜1+δ2(nTnCnT+nC)2(nT+nC−2)⎞⎠⎟=nT+nCnTnC+δ22(nT+nC−2)
Plug in our estimator for δ and we're done.