Ich habe in der Literatur zwei Definitionen für die Autokorrelationszeit einer schwach stationären Zeitreihe gefunden:
Dabei ist die Autokorrelation bei Verzögerung . k
Eine Anwendung der Autokorrelationszeit besteht darin, die "effektive Stichprobengröße" zu ermitteln: Wenn Sie Beobachtungen einer Zeitreihe haben und die Autokorrelationszeit , können Sie so tun, als hätten Sie
unabhängige Stichproben anstelle von korrelierten, um den Mittelwert zu ermitteln. Das Schätzen von von Daten ist nicht trivial, es gibt jedoch einige Möglichkeiten, dies zu tun (siehe Thompson 2010 ).
Die Definition ohne absolute Werte, , scheint in der Literatur üblicher zu sein; aber es gibt die Möglichkeit von . Mit R und dem "Coda" -Paket:τ a < 1
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
Die "effectiveSize" -Funktion in "coda" verwendet eine Definition der Autokorrelationszeit , die oben zu äquivalent ist. Es gibt einige andere R - Pakete gibt , die Compute effektive Stichprobengröße oder Autokorrelation Zeit, und alle diejenigen , die ich habe give Ergebnisse versucht konsistent mit diesem: dass ein AR (1) -Prozess mit einem negativen AR - Koeffizienten hat mehr effektive Proben als die korrelierte Zeitfolgen. Das scheint seltsam.
Offensichtlich kann dies in der Definition der Autokorrelationszeit niemals vorkommen .
Was ist die korrekte Definition der Autokorrelationszeit? Stimmt etwas nicht mit meinem Verständnis der effektiven Stichprobengrößen? Das oben gezeigte Ergebnis scheint falsch zu sein ... was ist los?