Theorie
Wenn die Autokorrelation eine Bedeutung haben soll, müssen wir annehmen, dass die ursprünglichen Zufallsvariablen dieselbe Varianz haben, die wir - durch eine geeignete Wahl der Maßeinheiten - auf Eins setzen können. Aus der Formel für die endliche DifferenzX.0,X.1, … ,X.N.L.th
X.( L )ich= (ΔL.( X.))ich=∑k = 0L.( - 1)L - k(L.k)X.i + k
für und die Unabhängigkeit des berechnen wir leicht0 ≤ i ≤ N.- L.X.ich
Var(X.( L )ich) =∑k = 0L.(L.k)2= (2 L.L.)(1)
und für und ,0 < j < Li ≤ N.- L - j
Cov(X.( L )ich,X.( L )i + j) = ( - 1)j∑k = 0L - j(L.k) (L.k + j) = ( - 1)j4L.(L.j) j! Γ(L+1/2)π- -- -√( L + j ) !.(2)
Dividieren nach gibt die lag- serielle Korrelation . Es ist negativ für ungerade und positiv für gerade .( 2 )( 1 )jρjjj
Stirlings Formel liefert eine leicht interpretierbare Annäherung
Log( |ρj| )≈- (j2L.- -j22L.2+j2(j2+ 1 )6L.3- -j44L.4+ O (L.- 5) O (j6) )
In Abhängigkeit von seine Größe ungefähr eine Gaußsche ("glockenförmige") Kurve, wie wir es von jedem diffusionsbasierten Verfahren wie aufeinanderfolgenden Differenzen erwarten würden. Hier ist eine Darstellung vondurchals Funktion von , die zeigt, wie schnell sich die serielle Korrelation nähert . In der Reihenfolge von oben nach unten stehen die Punkte fürdurch.j|ρ1||ρ5|L.1|ρ1||ρ5|
Schlussfolgerungen
Da es sich um rein mathematische Beziehungen handelt, verraten sie wenig über das . Da alle endlichen Differenzen lineare Kombinationen der ursprünglichen Variablen sind, liefern sie insbesondere keine zusätzlichen Informationen, die zur Vorhersage von aus .XiXN+1X0,X1,…,XN
Praktische Beobachtungen
Wenn wächst, wachsen die Koeffizienten in den linearen Kombinationen exponentiell. Beachten Sie, dass jedes eine alternierende Summe ist: Insbesondere erscheinen in der Mitte dieser Summe relativ große Koeffizienten in der Nähe von . Betrachten Sie die tatsächlichen Daten, die ein wenig zufälligem Rauschen ausgesetzt sind. Dieses Rauschen wird mit diesen großen Binomialkoeffizienten multipliziert, und dann werden diese großen Ergebnisse durch abwechselnde Addition und Subtraktion nahezu aufgehoben . Infolgedessen werden solche endlichen Differenzen für große berechnetLX(L)i(LL/2)Lneigt dazu, alle Informationen in den Daten zu löschen und spiegelt nur winzige Mengen an Rauschen wider, einschließlich Messfehler und Gleitkomma-Rundungsfehler. Die offensichtlichen Muster in den Unterschieden, die in der Frage für und liefern mit ziemlicher Sicherheit keine aussagekräftigen Informationen. (Die Binomialkoeffizienten für werden so groß wie und so klein wie , was bedeutet, dass ein Gleitkommafehler mit doppelter Genauigkeit die Berechnung dominieren wird.)L=100L=168L=10010291