Korrelation zwischen X und XY


11

Wenn ich zwei unabhängige Zufallsvariablen X und Y habe, wie ist die Korrelation zwischen X und dem Produkt XY? Wenn dies nicht bekannt ist, wäre ich daran interessiert, zumindest zu wissen, was im speziellen Fall passiert, wenn X und Y mit dem Mittelwert Null normal sind, wenn dies einfacher zu lösen ist.


4
Was motiviert diese Frage? Ich frage mich, ob es am besten wäre, wenn wir hier noch etwas anderes ansprechen. Führen Sie eine Studie durch, in der Sie aus irgendeinem Grund eine XY-Variable erstellt haben?
Gung - Reinstate Monica

Antworten:


13

Lösung

Ich gehe davon aus, dass eine gültige Lösung eine sein wird, die - wenn möglich - die Korrelation in Bezug auf die getrennten Eigenschaften der Variablen und Y ausdrückt . Berechnen der Korrelation wird beinhalten die Kovarianzen von Monome in Rechen X und Y . Es ist wirtschaftlich, dies auf einmal zu erledigen. Beobachten Sie das einfachXYXY

  1. Wenn und Y unabhängig sind und i und j Potenzen sind, sind X i und Y j unabhängig;XYijXiYj

  2. Die Erwartung eines Produkts unabhängiger Variablen ist das Produkt ihrer Erwartungen.

Dies gibt Formeln in Bezug auf die Momente von und Y .XY

Das ist alles dazu.


Einzelheiten

Schreiben Sie für die Momente usw. Für alle Zahlen i , j , k , l, für die die Berechnungen sinnvoll sind und endliche Zahlen ergeben,μi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

Beachten Sie, dass die Varianz einer Zufallsvariablen ihre Kovarianz mit sich selbst ist, sodass wir keine spezielle Berechnung für Varianzen durchführen müssen.

Es sollte nun offensichtlich sein, wie Momente mit Monomen, beliebigen Potenzen und einer endlichen Anzahl unabhängiger Zufallsvariablen berechnet werden können. Wenden Sie dieses Ergebnis als Anwendung auf die Definition der Korrelation an, bei der es sich um die Kovarianz geteilt durch die Quadratwurzeln der Varianzen handelt:

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

Es gibt verschiedene algebraische Vereinfachungen, die Sie auswählen können, wenn Sie dies mit Erwartungen, Abweichungen und Kovarianzen der ursprünglichen Variablen in Beziehung setzen möchten, aber wenn Sie sie hier ausführen, erhalten Sie keinen weiteren Einblick.


14

Unter Verwendung des Gesetzes der totalen Kovarianz und Unabhängigkeit von und Y , Cov ( X , X Y )XY Unter Verwendung des Gesetzes der totalen Varianz und wiederum der Unabhängigkeit wird Var ( X Y )

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Beachten Sie, wieYin einer der oben genannten inneren bedingten Erwartungen, Varianzen oder Kovarianzen als Konstante behandelt werden kann.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y

Aus der obigen Kovarianz und Varianz kann die Korrelation nach einigen algebraischen Manipulationen in Form der beiden Variationskoeffizienten als gut ausgedrückt werden.

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

A check of this result by simulation:

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373

Nice, but I would like to kindly point out a couple of things: 1. On the third line of the second set of equations, should there be a parenthesis as in E(Y2VarX)+Var(YEX)? 2. Are you sure that the person who asked the question follows the reasoning behind the different steps? E.g. That ECov(X,XY|Y)=EYCov(X,X) is so because Y is a given. I would suggest a minimal explanation for some of the steps.
Antoni Parellada

1
Yes, I added some parenthesis that were missing and some explanation. I have to admit I prefer the answer of @whuber though.
Jarle Tufto

5

In the specific case of X and Y being random variables with zero means, then ρ(XY,X)=0 because E(X2Y)=E[E[X2Y|X]]=E[X2E[Y|X]]=0. Hence cov(XY,X)=E(X2Y)E(XY).E(X)=0


-2

The Linear Correlation between X and XY will be,

Corr(X,XY) = Cov(X,XY) / sqrt(var(X)*var(XY))

Cov(X,XY) = Summation((X-mean(X))(XY-mean(XY)) / n

n - sample size; var(X) = variance of X; var(XY) = variance of XY


1
The question is about random variables, not about data.
whuber

how can we find whether 2 random variables are correlated or not? Through data only right. Correct me if I'm wrong. Apologies.
Sam Gladio

One computes correlation theoretically, using mathematical properties of random variables. It is very much the same thing as, say, computing the strength of a bridge design using the principles of Newtonian mechanics, compared to building bridges and testing them: there are distinct roles for theory and data and they should not be confused with one another.
whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.