Sowohl die Korrelation als auch die Kovarianz messen die lineare Assoziation zwischen zwei gegebenen Variablen und es besteht keine Verpflichtung, irgendeine andere Form der Assoziation zu erkennen.
Diese beiden Variablen können also auf verschiedene andere nichtlineare Arten verknüpft sein, und die Kovarianz (und daher die Korrelation) kann nicht vom unabhängigen Fall unterschieden werden.
Als sehr didaktischen, künstlichen und nicht realistisch Beispiel kann man prüfen , XX , so dass P ( X = x ) = 1 / 3P(X=x)=1/3 für x = - 1 , 0 , 1x=−1,0,1 und auch prüfen , Y = X 2Y=X2 . Beachten Sie, dass sie nicht nur verknüpft sind, sondern eine Funktion der anderen. Ihre Kovarianz ist jedoch 0, da ihre Assoziation orthogonal zu der Assoziation ist, die die Kovarianz erkennen kann.
BEARBEITEN
In der Tat war die obige ursprüngliche Antwort, wie von @whuber angegeben, tatsächlich eine Bemerkung darüber, dass die Behauptung nicht universell wahr ist, wenn beide Variablen nicht notwendigerweise dichotom wären. Mein Fehler!
Also lass uns rechnen. (Das örtliche Äquivalent zu Barney Stinsons "Suit up!")
Spezieller Fall
Sind sowohl XX und YY dichotomous waren, dann kann man davon ausgehen, ohne Beschränkung der Allgemeinheit, dass beide übernehmen nur die Werte 00 und 11 mit beliebigen Wahrscheinlichkeiten pp , qq und rr gegeben durch
P ( X = 1 ) = p ∈ [ 0 , 1 ] P ( Y = 1 ) = q ∈ [ 0 , 1 ] P ( X = 1 , Y= 1 ) = r ∈ [ 0 , 1 ] ,
P(X=1)=p∈[0,1]P(Y=1)=q∈[0,1]P(X=1,Y=1)=r∈[0,1],
die die gemeinsame Verteilung von
XXund
Yvollständig charakterisieren
Y. Beachten Sie, dass diese drei Werte ausreichen, um die gemeinsame Verteilung von
(X,Y)zu bestimmen
(X,Y), da
P ( X = 0 , Y = 1 )= P ( Y = 1 ) - P ( X = 1 , Y = 1 ) = q - r P ( X = 1 , Y = 0 )= P ( X = 1 ) - P ( X = 1 , Y = 1 ) = p - r P ( X = 0 , Y = 0 )= 1 - P ( X = 0 , Y = 1 ) - P ( X = 1 , Y = 0 ) - P ( X = 1 , Y = 1 )= 1 - ( q - r ) - ( p - r ) - r = 1 - p - q - r .
(Nebenbei bemerkt muss
rnatürlichsowohl
p-r∈[0,1],
q-r∈[0,1]als auch
1-p-q-r∈[P(X=0,Y=1)P(X=1,Y=0)P(X=0,Y=0)=P(Y=1)−P(X=1,Y=1)=q−r=P(X=1)−P(X=1,Y=1)=p−r=1−P(X=0,Y=1)−P(X=1,Y=0)−P(X=1,Y=1)=1−(q−r)−(p−r)−r=1−p−q−r.
rp−r∈[0,1]q−r∈[0,1]0,1]1−p−q−r∈[0,1] beyond
r∈[0,1]r∈[0,1], which is to say
r∈[0,min(p,q,1−p−q)]r∈[0,min(p,q,1−p−q)].)
Notice that r=P(X=1,Y=1)r=P(X=1,Y=1) might be equal to the product p⋅q=P(X=1)P(Y=1)p⋅q=P(X=1)P(Y=1), which would render XX and YY independent, since
P(X=0,Y=0)=1−p−q−pq=(1−p)(1−q)=P(X=0)P(Y=0)P(X=1,Y=0)=p−pq=p(1−q)=P(X=1)P(Y=0)P(X=0,Y=1)=q−pq=(1−p)q=P(X=0)P(Y=1).
P(X=0,Y=0)P(X=1,Y=0)P(X=0,Y=1)=1−p−q−pq=(1−p)(1−q)=P(X=0)P(Y=0)=p−pq=p(1−q)=P(X=1)P(Y=0)=q−pq=(1−p)q=P(X=0)P(Y=1).
Yes, rr might be equal to pqpq, BUT it can be different, as long as it respects the boundaries above.
Well, from the above joint distribution, we would have
E(X)=0⋅P(X=0)+1⋅P(X=1)=P(X=1)=pE(Y)=0⋅P(Y=0)+1⋅P(Y=1)=P(Y=1)=qE(XY)=0⋅P(XY=0)+1⋅P(XY=1)=P(XY=1)=P(X=1,Y=1)=rCov(X,Y)=E(XY)−E(X)E(Y)=r−pq
E(X)E(Y)E(XY)Cov(X,Y)=0⋅P(X=0)+1⋅P(X=1)=P(X=1)=p=0⋅P(Y=0)+1⋅P(Y=1)=P(Y=1)=q=0⋅P(XY=0)+1⋅P(XY=1)=P(XY=1)=P(X=1,Y=1)=r=E(XY)−E(X)E(Y)=r−pq
Now, notice then that XX and YY are independent if and only if Cov(X,Y)=0Cov(X,Y)=0. Indeed, if XX and YY are independent, then P(X=1,Y=1)=P(X=1)P(Y=1)P(X=1,Y=1)=P(X=1)P(Y=1), which is to say r=pqr=pq. Therefore, Cov(X,Y)=r−pq=0Cov(X,Y)=r−pq=0; and, on the other hand, if Cov(X,Y)=0Cov(X,Y)=0, then r−pq=0r−pq=0, which is to say r=pqr=pq. Therefore, XX and YY are independent.
General Case
About the without loss of generality clause above, if XX and YY were distributed otherwise, let's say, for a<ba<b and c<dc<d,
P(X=b)=pP(Y=d)=qP(X=b,Y=d)=r
P(X=b)=pP(Y=d)=qP(X=b,Y=d)=r
then
X′X′ and
Y′Y′ given by
X′=X−ab−aandY′=Y−cd−cX′=X−ab−aandY′=Y−cd−c
would be distributed just as characterized above, since
X=a⇔X′=0,X=b⇔X′=1,Y=c⇔Y′=0andY=d⇔Y′=1.X=a⇔X′=0,X=b⇔X′=1,Y=c⇔Y′=0andY=d⇔Y′=1.
So
XX and
YY are independent
if and only if X′X′ and
Y′ are independent.
Also, we would have
E(X′)=E(X−ab−a)=E(X)−ab−aE(Y′)=E(Y−cd−c)=E(Y)−cd−cE(X′Y′)=E(X−ab−aY−cd−c)=E[(X−a)(Y−c)](b−a)(d−c)=E(XY−Xc−aY+ac)(b−a)(d−c)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)Cov(X′,Y′)=E(X′Y′)−E(X′)E(Y′)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)−E(X)−ab−aE(Y)−cd−c=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)−a][E(Y)−c](b−a)(d−c)=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)E(Y)−cE(X)−aE(Y)+ac](b−a)(d−c)=E(XY)−E(X)E(Y)(b−a)(d−c)=1(b−a)(d−c)Cov(X,Y).
So
Cov(X,Y)=0 if and only Cov(X′,Y′)=0.
=D