Wie funktioniert die Formel zur Erzeugung korrelierter Zufallsvariablen?


19

Wenn wir 2 normale, nicht korrelierte Zufallsvariablen haben, können wir mit der Formel 2 korrelierte Zufallsvariablen erstellenX1,X2

Y=ρX1+1ρ2X2

und dann wird eine Korrelation mit .ρ X 1YρX1

Kann jemand erklären, woher diese Formel kommt?


1
Eine ausführliche Diskussion über dieses und verwandte Themen findet sich in meiner Antwort unter stats.stackexchange.com/a/71303 . Unter anderem ist es klar , dass (1) die Normalitätsannahme ist irrelevant und (2) müssen Sie zusätzliche Annahmen machen: die Varianzen von und muß , um die Korrelation gleich mit sein . X 2 Y X 1 ρX1X2YX1ρ
whuber

Sehr interessanter Link. Ich bin mir nicht sicher, ob ich verstehe, was du damit meinst, dass Normalität irrelevant ist. Wenn oder nicht normal ist und es schwieriger wird, die Dichte von durch den Kaiser-Dickman-Algorithmus zu steuern . Das ist der ganze Grund für Algorithmen spezialisiert nichtnormale korrelierten Daten zu erzeugen (zB Headrick, 2002; Ruscio & Kaczetow 2008; Vale & Maurelli, 1983) zum Beispiel Ihr Ziel vorstellen , ist zu generieren ~ normal, ~ Uniform mit = .5. Die Verwendung von ~ uniform führt zu einem , das nicht gleichmäßig ist ( schließlich eine lineare Kombination aus Normal und Uniform). X 2 Y X Y ρ X 2X1X2YXYρX2YYY
Anthony

@Anthony Die Frage fragt nur nach der Korrelation , die lediglich eine Funktion des ersten und des zweiten Moments ist. Die Antwort hängt nicht von anderen Eigenschaften der Verteilungen ab. Was Sie diskutieren, ist ein ganz anderes Thema.
whuber

Antworten:


17

Angenommen, Sie möchten eine lineare Kombination von und so dassX 2X1X2

corr(αX1+βX2,X1)=ρ

Beachten Sie , dass sich die Korrelation nicht ändert , wenn Sie sowohl als auch mit derselben (von Null verschiedenen) Konstante multiplizieren . Daher werden wir eine Bedingung hinzufügen, um die Varianz beizubehalten:β var ( α X 1 + β X 2 ) = var ( X 1 )αβvar(αX1+βX2)=var(X1)

Dies ist äquivalent zu

ρ=cov(αX1+βX2,X1)var(αX1+βX2)var(X1)=αcov(X1,X1)=var(X1)+βcov(X2,X1)=0var(αX1+βX2)var(X1)=αvar(X1)α2var(X1)+β2var(X2)

Angenommen, beide Zufallsvariablen haben dieselbe Varianz (dies ist eine entscheidende Annahme!) ( )var(X1)=var(X2)

ρα2+β2=α

Es gibt viele Lösungen für diese Gleichung, daher ist es an der Zeit, sich an die varianzerhaltende Bedingung zu erinnern:

var(X1)=var(αX1+βX2)=α2var(X1)+β2var(X2)α2+β2=1

Und das führt uns zu

α=ρβ=±1ρ2

UPD . Zur zweiten Frage: Ja, das nennt man Bleaching .


9

Die Gleichung ist eine vereinfachte bivariate Form der Cholesky-Zerlegung . Diese vereinfachte Gleichung wird manchmal als Kaiser-Dickman-Algorithmus bezeichnet (Kaiser & Dickman, 1962).

Beachten Sie, dass und dieselbe Varianz aufweisen müssen, damit dieser Algorithmus ordnungsgemäß funktioniert. Außerdem wird der Algorithmus normalerweise mit normalen Variablen verwendet. Wenn oder nicht normal sind, hat möglicherweise nicht die gleiche Verteilungsform wie .X 2 X 1 X 2 Y X 2X1X2X1X2YX2

Verweise:

Kaiser, HF & Dickman, K. (1962). Stichproben- und Populationsbewertungsmatrizen und Stichproben-Korrelationsmatrizen aus einer beliebigen Populationskorrelationsmatrix. Psychometrika, 27 (2), 179 & ndash; 182.


2
Ich nehme an, Sie brauchen keine standardisierten normalen Variablen, nur die gleiche Varianz sollte ausreichen.
Artem Sobolev

2
Nein, die Verteilung von ist nicht eine Mischung Verteilung wie Sie behaupten. Y
Dilip Sarwate

Punkt genommen, @Dilip Sarwate. Wenn entweder oder X 2 nicht normal ist, wird Y zu einer linearen Kombination von zwei Variablen, die möglicherweise nicht zur gewünschten Verteilung führen. Dies ist der Grund für spezialisierte Algorithmen (anstelle von Kaiser-Dickman) für generierte nicht normale korrelierte Daten. X1X2Y
Anthony

3

Korrelationskoeffizient ist der zwischen zwei Reihen , wenn sie als Vektoren behandelt werden (mit n t h Datenpunkt ist n t h Dimension eines Vektors). Die obige Formel erzeugt einfach eine Zerlegung eines Vektors in seine cos & thgr ; , s i n & thgr ; -Komponenten (in Bezug auf X 1 , X 2 ). wenn ρ = c o s θ , dann cosnthnthcosθsinθX1,X2
ρ=cosθ.1ρ2=±sinθ

Denn wenn nicht korreliert sind, ist der Winkel zwischen ihnen ein rechter Winkel (dh sie können als orthogonale, wenn auch nicht normalisierte Basisvektoren betrachtet werden).X1,X2


2
Willkommen auf unserer Webseite! Ich glaube, Ihr Beitrag wird mehr Aufmerksamkeit erhalten, wenn Sie die mathematischen Ausdrücke mit T markieren : Schließen Sie sie zwischen Dollarzeichen ein. Beim Bearbeiten steht Hilfe zur Verfügung. TEX
Whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.