Ist es bei drei gegebenen Vektoren , und möglich, dass die Korrelationen zwischen a und b , a und c und b und c alle negativ sind? Dh ist das möglich?b c a b a c b c
Ist es bei drei gegebenen Vektoren , und möglich, dass die Korrelationen zwischen a und b , a und c und b und c alle negativ sind? Dh ist das möglich?b c a b a c b c
Antworten:
Es ist möglich, wenn der Vektor 3 oder größer ist. Beispielsweise
Die Korrelationen lauten
Wir können beweisen, dass dies für Vektoren der Größe 2 nicht möglich ist:
Die Formel ist sinnvoll: Wenn größer als , muss größer als , damit die Korrelation negativ wird.a 2 b 1 b 1
Ähnliches gilt für Korrelationen zwischen (a, c) und (b, c)
Es ist klar, dass alle diese drei Formeln nicht gleichzeitig gelten können.
Ja, sie können.
Angenommen, Sie haben eine multivariate Normalverteilung . Die einzige Einschränkung für Σ ist, dass es sich um ein positives Semidefinit handeln muss.
Nehmen wir also das folgende Beispiel
Seine Eigenwerte sind alle positiv (1,2, 1,2, 0,6), und Sie können Vektoren mit negativer Korrelation erstellen.
Beginnen wir mit einer Korrelationsmatrix für 3 Variablen
Wenn zum Beispiel , sind die Werte von r auf 2 r ≥ r 2 + 1 beschränkt , wodurch r erzwungen wird
Beantwortung der interessanten Folgefrage von @amoeba: "Was ist die niedrigstmögliche Korrelation, die alle drei Paare gleichzeitig haben können?"
Sei , finde die kleinste Wurzel von 2 x 3 - 3 x
Eine einfache R-Funktion, um dies zu untersuchen:
f <- function(n,trials = 10000){
count <- 0
for(i in 1:trials){
a <- runif(n)
b <- runif(n)
c <- runif(n)
if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
count <- count + 1
}
}
count/trials
}
In Abhängigkeit von n
, f(n)
beginnt bei 0, wird bei n = 3
(mit typischen Werten um 0,06) ungleich Null , steigt dann um etwa 0,11 an n = 15
und scheint sich danach zu stabilisieren:
Es ist also nicht nur möglich, dass alle drei Korrelationen negativ sind, es scheint auch nicht ungewöhnlich zu sein (zumindest bei gleichmäßigen Verteilungen).