Kovarianz und Unabhängigkeit?


54

Ich habe aus meinem Lehrbuch gelesen, dass nicht garantiert, dass X und Y unabhängig sind. Aber wenn sie unabhängig sind, muss ihre Kovarianz 0 sein. Ich konnte mir noch kein richtiges Beispiel vorstellen; könnte jemand eine besorgen?cov(X,Y)=0


10
Sie können sich auch einen kurzen Überblick über Anscombes Quartett verschaffen , in dem einige der vielen verschiedenen Möglichkeiten erläutert werden, wie eine bestimmte Nicht-Null-Kovarianz durch einen bivariaten Datensatz realisiert werden kann.
Whuber

7
Zu beachten ist, dass das Maß der Kovarianz ein Maß der Linearität ist. Die Berechnung der Kovarianz beantwortet die Frage: Bilden die Daten ein gerades Linienmuster? Wenn die Daten einem linearen Muster folgen, sind sie daher abhängig. ABER dies ist nur eine Möglichkeit, in der die Daten abhängig sein können. Es ist so, als würde man fragen: Fahre ich rücksichtslos? Eine Frage könnte lauten: "Fahren Sie 40 km / h über dem Tempolimit?" Aber das ist nicht die einzige Möglichkeit, rücksichtslos zu fahren. Eine andere Frage könnte sein: "Bist du betrunken?" etc .. Es gibt mehr als eine Möglichkeit, rücksichtslos zu fahren.
Adam

Das sogenannte Linearitätsmaß gibt der Beziehung eine Struktur. Was wichtig ist, ist, dass die Beziehung nicht linear sein kann, was nicht ungewöhnlich ist. Im Allgemeinen ist Kovarianz nicht Null, Es ist hypothetisch. Die Kovarianz gibt die Größe und nicht ein Verhältnis,
Subhash C. Davar

Antworten:


48

Einfaches Beispiel: Sei eine Zufallsvariable, die mit einer Wahrscheinlichkeit von 0,5 oder . Dann sei eine Zufallsvariable, so dass wenn , und ist zufällig oder mit einer Wahrscheinlichkeit von 0,5, wenn .- 1 + 1 Y Y = 0 X = - 1 Y - 1 + 1 X = 1X1+1YY=0X=1Y1+1X=1

Es ist klar, dass und in hohem Maße abhängig sind (da ich perfekt kennen kann , wenn ich kenne ), aber ihre Kovarianz ist Null: Beide haben den Mittelwert Null undY Y XXYYX

E[XY]=(1)0P(X=1)+11P(X=1,Y=1)+1(1)P(X=1,Y=1)=0.

Oder allgemeiner, nimm eine beliebige Verteilung und eine beliebige so dass für alle (dh eine gemeinsame Verteilung, die ist) symmetrisch um die Achse), und Sie werden immer eine Kovarianz von Null haben. Aber Sie werden keine Unabhängigkeit haben, wenn ; dh die Bedingungen sind nicht alle gleich dem Rand. Oder auch für Symmetrie um die Achse.P(X)P(Y|X)P(Y=a|X)=P(Y=a|X)XxP(Y|X)P(Y)y


32

Hier ist das Beispiel, das ich den Schülern immer gebe. Nehmen Sie eine Zufallsvariable mit und , zB eine normale Zufallsvariable mit dem Mittelwert Null. Nimm . Es ist klar, dass und verwandt sind, aberXEX=0EX3=0Y=X2XY

cov(X,Y)=EXYEXEY=EX3=0.

Ich mag dieses Beispiel auch. In einem bestimmten Fall sind ein N (0,1) rv und ein Chi2 (1) rv nicht korreliert.
15.

3
+1, aber als kleiner Nitpick müssen Sie annehmen, dass separat (es folgt nicht aus der Annahme der Symmetrie der Verteilung oder von ), damit wir nicht Es gibt keine Probleme wie in der Form . Und ich bin beunruhigt über die Behauptung von @ ocram, dass " ein N (0,1) rv und ein Chi2 (1) rv nicht korreliert sind." (Hervorhebung hinzugefügt) Ja, und sind nicht korreliert, aber keine und Zufallsvariablen . E [ X ] = 0 E [ X 3 ] - X ~ N ( 0 , 1 ) , X 2 ~ χ 2 ( 1 ) N ( 0 , 1 ) , χ 2 ( 1 )E[X3]=0E[X]=0E[X3]XN(0,1)X2χ2(1) N(0,1)χ2(1)
Dilip Sarwate

@ DilipSarwate, danke, ich habe meine Antwort entsprechend bearbeitet. Als ich es schrieb, dachte ich über normale Variablen nach, für sie folgt der dritte Moment aus dem Mittelwert Null.
mpiktas

19

Das Bild unten (Quelle Wikipedia ) enthält eine Reihe von Beispielen in der dritten Zeile, insbesondere das erste und das vierte Beispiel haben eine starke abhängige Beziehung, aber keine Korrelation (und keine Kovarianz).

Bildbeschreibung hier eingeben


15

In einigen anderen Beispielen werden Datenpunkte betrachtet, die einen Kreis oder eine Ellipse bilden. Die Kovarianz ist 0, aber Sie wissen, dass Sie x auf 2 Werte einschränken y. Oder Daten in einem Quadrat oder Rechteck. Auch Daten, die ein X oder ein V oder ein ^ oder <oder> bilden, ergeben eine Kovarianz von 0, sind jedoch nicht unabhängig. Wenn y = sin (x) (oder cos) und x ein ganzzahliges Vielfaches von Perioden abdeckt, ist cov gleich 0, aber wenn Sie x kennen, wissen Sie y oder mindestens | y | in den Ellipsen x, <und>.


1
Das if sollte lauten "wenn x ein ganzzahliges Vielfaches von Perioden abdeckt, die an einer Spitze oder einem Tief beginnen" oder allgemeiner: "Wenn x ein Intervall abdeckt, in dem y symmetrisch ist"
naught101
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.