Die Korrelation misst die lineare Beziehung. Im informellen Kontext bedeutet Beziehung etwas Stabiles. Wenn wir die Probenkorrelation für stationäre Variablen berechnen und die Anzahl der verfügbaren Datenpunkte erhöhen, tendiert diese Probenkorrelation zur wahren Korrelation.
Es kann gezeigt werden, dass bei Preisen, bei denen es sich in der Regel um Zufallsbewegungen handelt, die Stichprobenkorrelation eher zu Zufallsvariablen tendiert. Dies bedeutet, dass das Ergebnis immer unterschiedlich ist, egal wie viele Daten wir haben.
Anmerkung Ich habe versucht, mathematische Intuition ohne Mathematik auszudrücken. Aus mathematischer Sicht ist die Erklärung sehr klar: Stichprobenmomente von stationären Prozessen konvergieren mit hoher Wahrscheinlichkeit zu Konstanten. Beispielmomente von Zufallsläufen konvergieren zu Integralen der Brownschen Bewegung, die Zufallsvariablen sind. Da die Beziehung normalerweise als Zahl und nicht als Zufallsvariable ausgedrückt wird, wird der Grund für die Nichtberechnung der Korrelation für nicht stationäre Variablen offensichtlich.
Update Da wir an der Korrelation zweier Variablen interessiert sind, nehmen wir zunächst an, dass sie aus dem stationären Prozess . Stationarität impliziert, dass E Z t und c o v ( Z t , Z t - h ) nicht von t abhängen . Also KorrelationZt= ( Xt, Yt)EZtc o v ( Zt, Zt - h)t
c o r r ( Xt, Yt) = c o v ( Xt, Yt)D XtD Yt-------√
hängt auch nicht von , da alle Größen in der Formel aus der Matrix c o v ( Z t ) stammen , die nicht von t abhängt . Also die Berechnung der Probenkorrelationtc o v ( Zt)t
macht Sinn, da wir begründete Hoffnung haben könnendassProbe Korrelation abschätzen wirdρ=corr(Xt,Yt). Es stellt sich herausdass diese Hoffnung nicht unbegründet ist, da für stationäre Prozesse erfüllen bestimmte Bedingungen wir diese haben& rgr;→
ρ^= 1T∑Tt = 1( Xt−X¯)(Yt−Y¯)1T2∑Tt =1(Xt-X¯)2∑Tt = 1(Yt-Y¯)2−--------------------------√
ρ=corr(Xt,Yt) , wie
T → ∞ in Wahrscheinlichkeit. Außerdem
√ρ^→ρT→∞inVerteilung, so dass wir die Hypothesen über testen
ρ.
T−−√(ρ^−ρ)→N(0,σ2ρ)ρ
Nehmen wir nun an, dass nicht stationär ist. Dann c o r r ( X t , Y t ) kann davon abhängen , t . Wenn wir also eine Stichprobe der Größe T beobachten, müssen wir möglicherweise T verschiedene Korrelationen ρ t abschätzen . Dies ist natürlich nicht möglich, daher können wir im besten Fall nur einige Funktionen von ρ t abschätzen, wie den Mittelwert oder die Varianz. Aber das Ergebnis kann nicht sinnvoll interpretiert werden.Ztc o r r ( Xt, Yt)tTTρtρt
Lassen Sie uns nun untersuchen, was mit der Korrelation des wahrscheinlich am häufigsten untersuchten instationären Prozess-Random-Walks geschieht. Wir nennen Prozess eine Zufallsbewegung, wenn Z t = Σ t s = 1 ( U t , V t ) , wobei C t = ( U t , V t ) ist ein stationärer Vorgang. Der Einfachheit halber sei E C t = 0 . DannZt= ( Xt, Yt)Zt=∑ts=1(Ut,Vt)Ct=(Ut,Vt)ECt=0
corr(XtYt)=EXtYtDXtDYt−−−−−−−√=E∑ts=1Ut∑ts=1VtD∑ts=1UtD∑ts=1Vt−−−−−−−−−−−−−−−−√
Zur weiteren Vereinfachung sei angenommen, dass ein weißes Rauschen ist. Dies bedeutet, dass alle Korrelationen E ( C t C t + h ) für h > 0 Null sind . Man beachte , dass dies nicht einschränkt c o r r ( U t , V t ) auf Null zurück .Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt)
Dann
corr(Xt,Yt)=tEUtVtt2DUtDVt−−−−−−−−√=corr(U0,V0).
So weit so gut, obwohl der Prozess nicht stationär ist, ist die Korrelation sinnvoll, obwohl wir dieselben restriktiven Annahmen treffen mussten.
Um nun zu sehen, was mit der Stichprobenkorrelation geschieht, müssen wir die folgende Tatsache über Zufallsbewegungen verwenden, die als funktionaler zentraler Grenzwertsatz bezeichnet wird:
inVerteilung, wobeis∈[0,1]undWs=(W1s,W2s)ist eine bivariateBrownsche Bewegung(zweidimensionaler Wiener-Prozess). Der Einfachheit halber Definition einführen
1T−−√Z[Ts]=1T−−√∑t=1[Ts]Ct→(cov(C0))−1/2Ws,
s∈[0,1]Ws=(W1s,W2s)Ms=(M1s,M2s)=(cov(C0))−1/2Ws.
Again for simplicity let us define sample correlation as
ρ^=1T∑Tt=1XtYt1T∑Tt=1X2t1T∑Tt=1Y2t−−−−−−−−−−−−−−−−−−√
Let us start with the variances. We have
E1T∑t=1TX2t=1TE∑t=1T(∑s=1tUt)2=1T∑t=1Ttσ2U=σUT+12.
This goes to infinity as T increases, so we hit the first problem, sample variance does not converge. On the other hand continuous mapping theorem in conjunction with functional central limit theorem gives us
1T2∑t=1TX2t=∑t=1T1T(1T−−√∑s=1tUt)2→∫10M21sds
where convergence is convergence in distribution, as
T→∞.
Similarly we get
1T2∑t=1TY2t→∫10M22sds
and
1T2∑t=1TXtYt→∫10M1sM2sds
So finally for sample correlation of our random walk we get
ρ^→∫10M1sM2sds∫10M21sds∫10M22sds−−−−−−−−−−−−−−−√
in distribution as
T→∞.
So although correlation is well defined, sample correlation does not converge towards it, as in stationary process case. Instead it converges to a certain random variable.