Einfache Beispiele für nicht korreliertes, aber nicht unabhängiges


26

Jeder fleißige Student ist ein Gegenbeispiel zu "alle Studenten sind faul".

Was sind einige einfache Gegenbeispiele zu "Wenn die Zufallsvariablen X und Y nicht korreliert sind, sind sie unabhängig"?


8
Ich denke, das ist ein Duplikat, aber ich bin zu faul, um danach zu suchen. Nimm und Y = X 2 . c o v ( X , Y ) = E X 3 = 0 , aber eindeutig sind die beiden Variablen nicht unabhängig. XN(0,1)Y=X2cov(X,Y)=EX3=0
mpiktas

1
ein einfaches Beispiel (obwohl es vielleicht noch einfachere gibt)
Glen_b

1
Nehmen gleichmäßig verteilt wird auf [ 0 , 2 π ] und X = cos U , Y = sin U . U[0,2π]X=cosUY=sinU
Dilip Sarwate

Da der Sinn des "Einfachsten" undefiniert ist, ist diese Frage nicht objektiv zu beantworten. Ich habe das Duplikat unter stats.stackexchange.com/questions/41317 aufgrund der einfachsten = kleinsten Summe der Kardinalitäten der Unterstützungen der Randverteilungen ausgewählt.
Whuber

3
@whuber: Obwohl „einfachste“ ist in der Tat nicht sehr gut definiert, die Antworten hier zB die Antwort von Glen_b bieten eindeutig viel einfaches Beispiel als das Gewinde Sie diesen von als Duplikat geschlossen. Ich schlage vor, diesen erneut zu eröffnen (ich habe bereits abgestimmt), und vielleicht CW zu machen, um die Tatsache hervorzuheben, dass "einfachste" schlecht definiert sind und OP möglicherweise nach verschiedenen "einfachen" Beispielen fragt.
Amöbe sagt Reinstate Monica

Antworten:


17

Lass .XU(1,1)

Sei .Y=X2

Die Variablen sind nicht korreliert, aber abhängig.

Alternativ kann eine diskrete bivariate Verteilung betrachtet werden, die aus einer Wahrscheinlichkeit bei 3 Punkten (-1,1), (0, -1), (1,1) mit einer Wahrscheinlichkeit von 1/4, 1/2 bzw. 1/4 besteht. Dann sind Variablen unkorreliert, aber abhängig.

Betrachten Sie bivariate Daten, die in einer Raute einheitlich sind (ein um 45 Grad gedrehtes Quadrat). Die Variablen sind nicht korreliert, aber abhängig.

Das sind die einfachsten Fälle, die mir einfallen.


Sind alle Zufallsvariablen, die symmetrisch und um 0 zentriert sind, nicht korreliert?
Martin Thoma

1
@moose Ihre Beschreibung ist nicht eindeutig. Wenn Sie "wenn um Null symmetrisch ist und Y um Null symmetrisch ist" meinen, dann nein, da beispielsweise eine bivariate Normale mit Standardnormalenrändern korreliert werden kann. Wenn Sie meinen "wenn X symmetrisch um Null ist und Y eine gerade Funktion von X ist ", dann glaube ich, dass die Antwort ja ist, solange die Varianzen existieren. Wenn du etwas anderes meinst, musst du es erklären. XYXYX
Glen_b

7

Ich denke, die Essenz einiger der einfachen Gegenbeispiele kann gesehen werden, indem mit einer kontinuierlichen Zufallsvariablen die auf Null zentriert ist, dh E [ X ] = 0 . Angenommen, das PDF von X ist gerade und in einem Intervall der Form ( - a , a ) definiert , wobei a > 0 ist . Nehmen wir nun an, Y = f ( X ) für eine Funktion f . Wir stellen nun die Frage: Für welche Art von Funktionen f ( X ) können wir C o habenXE[X]=0X(a,a)a>0Y=f(X)ff(X) & le;Cov(X,f(X))=0

Wir wissen , dass . Unsere Annahme, dass E [ X ] = 0 ist, führt uns direkt zu C o v ( X , f ( X ) ) = E [ X fCov(X,f(X))=E[Xf(X)]E[X]E[f(X)]E[X]=0 . Bezeichnendie pdf von X über p ( ) , haben wirCov(X,f(X))=E[Xf(X)]Xp()

.Cov(X,f(X))=E[Xf(X)]=aaxf(x)p(x)dx

Wir wollen und ein Weg , dies zu erreichen , ist , indem sichergestellt wird f ( x ) eine gerade Funktion, was bedeutet , x f ( x ) p ( x ) ist eine ungerade Funktion. Daraus folgt, dass a - a x f ( x ) p ( x ) d x = 0 ( X , f (Cov(X,f(X))=0f(x)xf(x)p(x)aaxf(x)p(x)dx=0 und damit .Cov(X,f(X))=0

Auf diese Weise können wir sehen, dass die genaue Verteilung von unwichtig ist, da das PDF um einen bestimmten Punkt symmetrisch ist und jede gerade Funktion f ( ) für die Definition von Y ausreicht .Xf()Y

Hoffentlich können die Schüler so sehen, wie die Leute auf diese Art von Gegenbeispielen kommen.


5

Seien Sie das Gegenbeispiel (dh fleißiger Student)! Nachdem das gesagt worden ist:

Ich habe versucht, an ein Beispiel aus der realen Welt zu denken, und dies war das erste, das mir in den Sinn kam. Dies ist nicht der mathematisch einfachste Fall (aber wenn Sie dieses Beispiel verstehen, sollten Sie in der Lage sein, ein einfacheres Beispiel mit Urnen und Bällen oder so etwas zu finden).

Nach einigen Untersuchungen ist der durchschnittliche IQ von Männern und Frauen derselbe, aber die Varianz des männlichen IQ ist größer als die Varianz des weiblichen IQ. Der Vollständigkeit halber sei angenommen, dass der männliche IQ auf folgt und der weibliche IQ auf N ( 100 , α σ 2 ) mit α < 1 folgt . Die Hälfte der Bevölkerung ist männlich und die Hälfte weiblich.N(100,σ2)N(100,ασ2)α<1

Vorausgesetzt, diese Untersuchung ist richtig:

Wie hängen Geschlecht und IQ zusammen?

Sind Geschlecht und IQ unabhängig?


4

Wir können eine diskrete Zufallsvariable mit P ( X = - 1 ) = P ( X = 0 ) = P ( X = 1 ) = 1 definierenX{1,0,1}P(X=1)=P(X=0)=P(X=1)=13

und dann definiere Y={1,ifX=00,otherwise

Es kann leicht überprüft werden, dass und Y nicht korreliert, aber nicht unabhängig sind.XY


2

Versuchen Sie dies (R-Code):

x=c(1,0,-1,0);  
y=c(0,1,0,-1);  

cor(x,y);  
[1] 0

x2+y2r2=0

Yx


1
Die Stichprobenkorrelation Null bedeutet nicht, dass die wahre Korrelation Null ist.
mpiktas

3
@mpiktas Wenn diese vier Werte eine bivariate Verteilung mit einer Wahrscheinlichkeit von jeweils 1/4 darstellen, gibt die corFunktion, die Null zurückgibt , eine Populationskorrelation von Null an.
Glen_b -Reinstate Monica

@ Glen_b Ich hätte den Code besser kommentieren sollen. Dies ist möglicherweise nicht allen bekannt. Sie können Semikolons verwenden, von denen ich denke, dass sie in R.
Analyst

1
@ Glen_b ja du bist richtig. Dies wurde jedoch nicht angegeben. Schöne Beobachtung übrigens.
mpiktas

1

Der einzige allgemeine Fall, in dem fehlende Korrelation Unabhängigkeit impliziert, ist, wenn die gemeinsame Verteilung von X und Y Gaußsch ist.


2
Dies beantwortet die Frage nicht direkt mit einem einfachen Beispiel - in diesem Sinne handelt es sich eher um einen Kommentar -, sondern liefert eine indirekte Antwort, indem es eine sehr breite Palette möglicher Beispiele vorschlägt. Es könnte sich lohnen, diesen Beitrag neu zu formulieren, um klarer zu machen, wie die ursprüngliche Frage beantwortet wird.
Silverfish

-1

A two-sentence answer: the clearest case of uncorrelated statistical dependence is a non-linear function of a RV, say Y = X^n. The two RVs are clearly dependent but yet not correlated, because correlation is a linear relationship.


Unless for some very specific distributions of X, the RVs X and Y=Xn will usually be correlated.
StijnDeVuyst

This answer is incorrect. In R: Expression: {x <- runif(100); cor(x, x^3)} Result: 0.9062057
Josh
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.