Wenn ich einen zufälligen Spaziergang mit einem AR (1) schätze, ist der Koeffizient sehr nahe an 1, aber immer kleiner.
Was ist der mathematische Grund, warum der Koeffizient nicht größer als eins ist?
Wenn ich einen zufälligen Spaziergang mit einem AR (1) schätze, ist der Koeffizient sehr nahe an 1, aber immer kleiner.
Was ist der mathematische Grund, warum der Koeffizient nicht größer als eins ist?
Antworten:
Wir schätzen durch OLS das Modell
Für eine Stichprobe der Größe T ist der Schätzer
Dies wird manchmal als "Dickey-Fuller" -Distribution bezeichnet, da es die Basis für die kritischen Werte ist, die zur Durchführung der gleichnamigen Unit-Root-Tests verwendet werden.
Ich erinnere mich nicht einen Versuch zu sehen , zu schaffen , Intuition für die Form der Stichprobenverteilung. Wir betrachten die Stichprobenverteilung der Zufallsvariablen
Wenn wir unabhängige Produktnormalen addieren, erhalten wir eine Verteilung, die um Null herum symmetrisch bleibt. Zum Beispiel:
Aber wenn wir nicht unabhängige Produktnormalen summieren, wie es unser Fall ist, erhalten wir
die nach rechts geneigt ist, aber mit größerer Wahrscheinlichkeit Masse den negativen Werten zugeordnet. Und die Masse scheint noch mehr nach links verschoben zu werden, wenn wir die Stichprobengröße erhöhen und der Summe mehr korrelierte Elemente hinzufügen.
Der Kehrwert der Summe nicht unabhängiger Gammas ist eine nicht negative Zufallsvariable mit positivem Versatz.
Dies ist keine wirkliche Antwort, aber zu lang für einen Kommentar, also poste ich dies trotzdem.
Bei einer Stichprobengröße von 100 (mit "R") konnte ich zweimal von hundert einen Koeffizienten von mehr als 1 erhalten:
N=100 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~y[-T]) # regress y on its own first lag, with intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1
Die Realisierungen 84 und 95 haben einen Koeffizienten über 1, so dass er nicht immer unter eins liegt. Es besteht jedoch eindeutig die Tendenz zu einer nach unten gerichteten Schätzung. Die Fragen bleiben, warum ?
Bearbeiten: Die obigen Regressionen enthielten einen Intercept-Term, der nicht zum Modell zu gehören scheint. Sobald der Achsenabschnitt entfernt ist, erhalte ich viele weitere Schätzungen über 1 (3158 von 10000) - aber immer noch deutlich unter 50% aller Fälle:
N=10000 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1