Varianz der Cohen-


12

Cohens d ist eine der häufigsten Methoden, um die Größe eines Effekts zu messen ( siehe Wikipedia ). Es misst einfach den Abstand zwischen zwei Mitteln als gepoolte Standardabweichung. Wie können wir die mathematische Formel der Varianzschätzung von Cohens ableiten d?

Dezember 2015 edit: Im Zusammenhang mit dieser Frage steht die Idee , Konfidenzintervalle um berechnend . Dieser Artikel besagt, dass

σd2=n+n×+d22n+

Dabei ist n+ die Summe der beiden Stichprobengrößen und n× das Produkt der beiden Stichprobengrößen.

Wie leitet sich diese Formel ab?


@Clarinetist: Es ist etwas umstritten, die Frage einer anderen Person zu bearbeiten, um ihr mehr Inhalt und mehr Fragen hinzuzufügen (im Gegensatz zur Verbesserung des Wortlauts). Ich habe mir die Freiheit genommen, Ihre Bearbeitung zu genehmigen (vorausgesetzt, Sie haben eine großzügige Prämie gezahlt und ich denke, dass Ihre Bearbeitung die Frage verbessert), aber andere entscheiden sich möglicherweise für einen Rollback.
Amöbe sagt Reinstate Monica

1
@amoeba Kein Problem. Solange die Formel für (was vorher nicht vorhanden war) und klar ist, dass wir nach einer mathematischen Ableitung der Formel suchen, ist das in Ordnung. σd2
Klarinettist

Ich denke, der Nenner der zweiten Fraktion sollte . Siehe meine Antwort unten. 2(n+2)

Antworten:


15

Beachten Sie, dass der Varianzausdruck in der Frage eine Annäherung ist. Hedges (1981) leitete die große Stichprobenvarianz von und Approximation in einer allgemeinen Umgebung (dh mehrere Experimente / Studien) ab, und meine Antwort geht so ziemlich durch die Ableitungen in der Arbeit.d

Zunächst werden die folgenden Annahmen verwendet:

Nehmen wir an, wir haben zwei unabhängige Behandlungsgruppen, (Behandlung) und C (Kontrolle). Lassen Y T i und Y C j die Werte sein / Antworten / was auch immer von Subjekt i in Gruppe T und Subjekt j in Gruppe C ist.TCYTiYCjiTjC

Wir gehen davon aus, dass die Reaktionen normal verteilt sind und die Behandlungs- und Kontrollgruppen eine gemeinsame Varianz aufweisen, d. H

YTiN(μT,σ2),i=1,nTYCjN(μC,σ2),j=1,nC

Die Effektgröße, die wir in jeder Studie schätzen möchten, ist . Der Schätzer der verwendeten Effektgröße ist d= ˉ Y T- ˉ Y Cδ=μTμCσ wobeiS2kdie unverzerrte Stichprobenvarianz für die Gruppek ist.

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2
Sk2k

Betrachten wir die Eigenschaften von für große Stichproben . d

Beachten Sie zunächst, dass: und (mit meiner Notation locker): ( n T - 1 ) S 2 T

Y¯TY¯CN(μTμC,σ2nT+nCnTnC)
und (nC-1)S 2 C
(1)(nT1)ST2σ2(nT+nC2)=1nT+nC2(nT1)ST2σ21nT+nC2χnT12
(2)(nC1)SC2σ2(nT+nC2)=1nT+nC2(nC1)SC2σ21nT+nC2χnC12

1σ2(nT1)ST2+(nC1)SC2nT+nC21nT+nC2χnT+nC22

Now, some clever algebra:

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2=(σnT+nCnTnC)1(Y¯TY¯C)(σnT+nCnTnC)1(nT1)ST2+(nC1)SC2nT+nC2=(Y¯TY¯C)(μTμC)σnT+nCnTnC+μTμCσnT+nCnTnC(nT+nCnTnC)1(nT1)ST2+(nC1)SC2σ2(nT+nC2)=nT+nCnTnC(θ+δnTnCnT+nCVν)
where θN(0,1), Vχν2, and ν=nT+nC2. Thus, d is nT+nCnTnC times a variable which follows a non-central t-distribution with nT+nC2 degrees of freedom and non-centrality parameter of δnTnCnT+nC.

Using the moment properties of the non-central t distribution, it follows that:

(3)Var(d)=(nT+nC2)(nT+nC4)(nT+nC)nTnC(1+δ2nTnCnT+nC)δ2b2
where
b=Γ(nT+nC22)nT+nC22Γ(nT+nC32)134(nT+nC2)1

So Equation (3) provides the exact large sample variance. Note that an unbiased estimator for δ is bd, with variance:

Var(bd)=b2(nT+nC2)(nT+nC4)(nT+nC)nTnC(1+δ2nTnCnT+nC)δ2

For large degrees of freedom (i.e. large nT+nC2), the variance of a non-central t variate with ν degrees of freedom and non-centrality parameter p can be approximated by 1+p22ν (Johnson, Kotz, Balakrishnan, 1995). Thus, we have:

Var(d)nT+nCnTnC(1+δ2(nTnCnT+nC)2(nT+nC2))=nT+nCnTnC+δ22(nT+nC2)

Plug in our estimator for δ and we're done.


Sehr, sehr schöne Ableitung. Nur ein paar Fragen: 1) Könnten Sie die Notation klärenY.¯ichT-Y.¯ichCmeans (Ich weiß, es hat etwas mit dem Unterschied der Stichprobenmittelwerte zu tun, aber wie können beide denselben Index haben?) 2) könnten Sie klarstellen, wie die Annäherung fürb is done (I don't need all of the details, a source is fine and maybe a brief explanation)? Otherwise, I'm quite pleased with this. (+1) This also agrees with the observation that I've made that d doesn't follow a normal distribution, contrary to the explanation in the linked article in the OP.
Clarinetist

@Clarinetist Thanks! 1) How can they have the same index? Typo, that's how! :P They're an artifact of my first draft of the answer. I'll fix that. 2) I pulled it from the Hedges paper -- don't know its derivation at the moment but will think about it some more.

I'm looking into the derivation now, but FYI, the numerator of b should be Γ(nT+nC22).
Clarinetist

Derivation provided for reference: math.stackexchange.com/questions/1564587/… . Turns out there's likely a sign error.
Clarinetist

@mike : very impressing answer. Thanks for taking the time to share it with us.
Denis Cousineau
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.