Die einfache Version ist, dass zwei Variablen, die dazu neigen, sich im Laufe der Zeit in eine Richtung zu ändern, korreliert zu sein scheinen, unabhängig davon, ob eine Verbindung zwischen ihnen besteht oder nicht. Betrachten Sie die folgenden Variablen:
set.seed(1)
time = seq(from=1, to=100, by=1)
x = .5 + .3*time + rnorm(100)
y1 = 3 + .3*time + rnorm(100)
y2 = 7 + .1*time + .8*x + rnorm(100)
ist nur eine Funktion der Zeit, ebenso wie y 1 . y 2 ist eine Funktion von Zeit und x . Der Punkt ist, anhand des Codes zu erkennen, dass es wirklich eine Beziehung zwischen x und y 2 gibt und dass es keine Beziehung zwischen x und y 1 gibt . Schauen Sie sich nun die folgende Abbildung an, alle drei Linien sehen sich schrecklich ähnlich, nicht wahr?xy1y2xxy2xy1
In der Tat, der - Wert für die Beziehung zwischen x und y 1 beträgt 98%, und die R 2 für x und y 2 ist , 99%. Aber wir wissen, dass es keine reale Beziehung zwischen x und y 1 gibt , wohingegen es zwischen x und y 2 gibtR2xy1R2xy2xy1xy2Wie unterscheiden wir also das Reale vom bloßen Schein? Hier kommt die Differenzierung ins Spiel. Für zwei der Variablen ist dies nicht sehr informativ, da beide im Laufe der Zeit ansteigen. Aber sagt uns das, wenn man einen bestimmten Betrag ansteigt, wie viel der andere ansteigt? Durch Differenzierung können wir diese Frage beantworten. Beachten Sie die folgenden zwei Abbildungen, Streudiagramme, die ich nach dem Unterscheiden aller drei Variablen erstellt habe.
xy2R2=.43xy1R2=.07R2
Einige andere Punkte: In den Abbildungen stelle ich fest, dass es sich um gleichzeitige Änderungen handelt. Daran ist nichts auszusetzen, und es ergibt sich aus der Art und Weise, wie ich das Problem angestellt habe, aber normalerweise sind die Leute an Effekten mit einer gewissen Verzögerung interessiert. (Das heißt, eine Änderung zu einem bestimmten Zeitpunkt führt zu einer späteren Änderung.) Zweitens erwähnen Sie, dass Sie das Protokoll einer Ihrer Serien führen. Durch die Protokollierung werden Ihre Daten einfach von Level zu Rate gewechselt. Wenn Sie also einen Unterschied machen, sehen Sie eher Änderungen der Raten als Änderungen der Pegel. Das ist sehr verbreitet, aber ich habe dieses Element nicht in meine Demonstration aufgenommen. Es ist orthogonal zu den Themen, die ich besprochen habe. Zuletzt möchte ich anerkennen, dass Zeitreihendaten oft komplizierter sind, als es meine Demonstration zulässt.