Entnommen aus der praktischen Statistik für die medizinische Forschung, in der Douglas Altman auf Seite 285 schreibt:
... für zwei beliebige Größen X und Y wird X mit XY korreliert. Selbst wenn X und Y Stichproben von Zufallszahlen sind, würden wir eine Korrelation von X und XY von 0,7 erwarten
Ich habe es in R versucht und es scheint der Fall zu sein:
x <- rnorm(1000000, 10, 2)
y <- rnorm(1000000, 10, 2)
cor(x, x-y)
xu <- sample(1:100, size = 1000000, replace = T)
yu <- sample(1:100, size = 1000000, replace = T)
cor(xu, xu-yu)
Warum ist das so? Was ist die Theorie dahinter?