Definition der Autokorrelationszeit (für effektive Stichprobengröße)


23

Ich habe in der Literatur zwei Definitionen für die Autokorrelationszeit einer schwach stationären Zeitreihe gefunden:

τa=1+2k=1ρkversusτb=1+2k=1|ρk|

Dabei ist die Autokorrelation bei Verzögerung . kρk=Cov[Xt,Xt+h]Var[Xt]k

Eine Anwendung der Autokorrelationszeit besteht darin, die "effektive Stichprobengröße" zu ermitteln: Wenn Sie n Beobachtungen einer Zeitreihe haben und die Autokorrelationszeit τ , können Sie so tun, als hätten Sie

neff=nτ

unabhängige Stichproben anstelle von n korrelierten, um den Mittelwert zu ermitteln. Das Schätzen von τ von Daten ist nicht trivial, es gibt jedoch einige Möglichkeiten, dies zu tun (siehe Thompson 2010 ).

Die Definition ohne absolute Werte, , scheint in der Literatur üblicher zu sein; aber es gibt die Möglichkeit von . Mit R und dem "Coda" -Paket:τ a < 1τaτa<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

Die "effectiveSize" -Funktion in "coda" verwendet eine Definition der Autokorrelationszeit , die oben zu äquivalent ist. Es gibt einige andere R - Pakete gibt , die Compute effektive Stichprobengröße oder Autokorrelation Zeit, und alle diejenigen , die ich habe give Ergebnisse versucht konsistent mit diesem: dass ein AR (1) -Prozess mit einem negativen AR - Koeffizienten hat mehr effektive Proben als die korrelierte Zeitfolgen. Das scheint seltsam. τa

Offensichtlich kann dies in der Definition der Autokorrelationszeit niemals vorkommen .τb

Was ist die korrekte Definition der Autokorrelationszeit? Stimmt etwas nicht mit meinem Verständnis der effektiven Stichprobengrößen? Das oben gezeigte Ergebnis scheint falsch zu sein ... was ist los?neff>n


Nur um sicherzugehen, dass ich nichts falsch verstanden habe, sollte das nicht anstelle des ? Cov(Xt,Xt+k)h
Sachinruk

2
Ich interessiere mich für die zweite Definition, dh . Können Sie die Literatur dort bereitstellen, wo Sie sie gefunden haben? τb
Harry

Antworten:


17

Erstens ist die angemessene Definition des Begriffs "effektive Stichprobengröße" IMO mit einer ganz bestimmten Frage verbunden. Wenn sind identisch mit dem Mittelwert verteilt μ und die Varianz 1 der empirische Mittelwert μ = 1X1,X2,μ ist ein unverzerrter Schätzer vonμ. Aber was ist mit seiner Varianz? FürunabhängigeVariablen beträgt die Varianzn-1. Für eine schwach stationären Zeitreihen, die Varianz von μ ist 1

μ^=1nk=1nXk
μn1μ^ Die Näherung gilt für ausreichend großen. Wenn wirneff=n/τa definieren, beträgt die Varianz des empirischen Mittels für eine schwach stationäre Zeitreihe ungefährn - 1 eff , was der gleichen Varianz entspricht, als ob wirneffunabhängige Stichproben hätten. Somit istneff=n/τaeine geeignete Definition, wenn wir nach der Varianz des empirischen Durchschnitts fragen. Es könnte für andere Zwecke ungeeignet sein.
1n2k,l=1ncov(Xk,Xl)=1n(1+2(n1nρ1+n2nρ2++1nρn1))τan.
nneff=n/τaneff1neffneff=n/τa

Bei negativer Korrelation zwischen Beobachtungen ist es durchaus möglich, dass die Varianz kleiner als ( n eff > n ). Dies ist eine bekannte Varianzreduktionstechnik in der Monto-Carlo-Integration: Wenn wir anstelle der Korrelation 0 eine negative Korrelation zwischen den Variablen einführen, können wir die Varianz reduzieren, ohne die Stichprobengröße zu erhöhen.n1neff>n


2
Wenn Sie mehr über die Verwendung negativer Korrelationen in der Monte-Carlo-Simulation erfahren möchten, versuchen Sie, "antithetische Variablen" zu googeln. Mehr Infos in den Kursnotizen hier oder hier .
Andrewtinka

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.