Modellfehlerbegriffe mit gleitendem Durchschnitt


17

Dies ist eine grundlegende Frage zu Box-Jenkins MA-Modellen. Wie ich es verstehe, ist ein MA - Modell im Grunde eine lineare Regression von Zeitreihenwerten Y gegen vorherige Fehlerterme et,...,etn . Das heißt, die Beobachtung Y wird zuerst gegen ihre vorherigen Werte zurückgebildet Yt1,...,Ytn und dann ein oder mehr YY^ sind Werte wie die Fehler - Terme für das MA - Modell verwendet.

Aber wie werden die Fehlerterme in einem ARIMA-Modell (0, 0, 2) berechnet? Wenn das MA-Modell ohne autoregressiven Teil und damit ohne geschätzten Wert verwendet wird, wie kann ich möglicherweise einen Fehlerbegriff haben?


1
Nein, ich denke, Sie verwechseln die Definition eines MA (n) - Modells, bei dem die Regression nur in Bezug auf die , mit ihrer Schätzung, bei der die e t - i aus den Daten geschätzt werden . etieti
Xi'an

1
Das Hauptproblem in Ihrer Frage ist, dass Sie sagen, dass das MA-Modell im Grunde eine lineare Regression ist. Dies ist einfach nicht wahr, da wir Fehlerbedingungen nicht beachten.
mpiktas

Ich denke , dass der Fehlerterm ist eigentlich , wobei Y ist E ( Y | Y t , . . . , T - n ) oder einfach Y t - Y t - 1 . Aus diesem Grund wird eine Parameterschätzung des MA-Modells aus einem wiederkehrenden Muster in der partiellen Y- Autokorrelationsfunktion abgeleitet, dh dem Verhalten der Residuen. Die AR-Parameterschätzung basiert stattdessen auf einem wiederkehrenden Muster von acf (Y).YtYt^Y^E(Y|Yt,...,tn)YtYt1Y
Robert Kubrick

Antworten:


20

MA-Modellschätzung:

Nehmen wir eine Serie mit 100 Zeitpunkten an und sagen wir, dies ist durch ein MA (1) -Modell ohne Achsenabschnitt gekennzeichnet. Dann ist das Modell gegeben durch

yt=εtθεt1,t=1,2,,100(1)

Der Fehlerterm wird hier nicht beachtet. Um dies zu erreichen, haben Box et al. Die Zeitreihenanalyse: Forecasting and Control (3. Ausgabe) , Seite 249 , legt nahe, dass der Fehlerterm rekursiv berechnet wird durch:

εt=yt+θεt1

Der Fehlerterm für ist also: ε 1 = y 1 + θ ε 0 Nun können wir dies nicht berechnen, ohne den Wert von θ zu kennen . Um dies zu erhalten, müssen wir die anfängliche oder vorläufige Schätzung des Modells berechnen, siehe Box et al. des genannten Buches, Abschnitt 6.3.2 Seite 202 besagen, dass,t=1

ε1=y1+θε0
θ

Es hat sich gezeigt , dass die ersten Autokorrelationen von MA ( q ) -Prozesses sind ungleich Null und kann , wie in Bezug auf die Parameter des Modells geschrieben werden & rho; k = - θ k + θ 1 θ k + 1 + θ 2 θ k + 2 + +qq Der obige Ausdruck für ρ 1 , ρ 2, ρ q in Termen θ 1 , θ 2 , , θ q liefert q Gleichungen in q Unbekannten. Vorläufige Schätzungen von & thgr; s können erhalten werden, indem Schätzungen r k für & rgr; k in der obigen Gleichung eingesetzt werden

ρk=θk+θ1θk+1+θ2θk+2++θqkθq1+θ12+θ22++θq2k=1,2,,q
ρ1,ρ2,ρqθ1,θ2,,θqqqθrkρk

Es ist zu beachten, dass die geschätzte Autokorrelation ist. Weitere Informationen finden Sie in Abschnitt 6.3 - Erste Schätzungen für die Parameter . Lesen Sie hierzu bitte weiter. Angenommen, wir erhalten die anfängliche Schätzung θ = 0,5 . Dann ist ε 1 = y 1 + 0,5 ε 0. Ein weiteres Problem ist, dass wir für ε 0 keinen Wert habenrkθ=0.5

ε1=y1+0.5ε0
ε0 da bei 1 beginnt und wir daher ε 1 nicht berechnen können . Zum Glück gibt es zwei Methoden, um dies zu erreichen,tε1
  1. Bedingte Wahrscheinlichkeit
  2. Bedingungslose Wahrscheinlichkeit

Laut Box et al. In Abschnitt 7.1.3 auf Seite 227 können die Werte von als Näherung durch Null ersetzt werden, wenn nε0n moderat oder groß ist. Bei dieser Methode handelt es sich um die bedingte Wahrscheinlichkeit. Andernfalls wird die bedingungslose Wahrscheinlichkeit verwendet, wobei der Wert von durch Rückvorhersage erhalten wird, Box et al. empfehlen diese Methode. Weitere Informationen zur Rückvorhersage finden Sie in Abschnitt 7.1.4 auf Seite 231 .ε0

Nach dem Erhalten der anfänglichen Schätzungen und des Wertes von ε0 wir ; , können wir schließlich mit der rekursiven Berechnung des Fehlerausdrucks fortfahren. Als letztes müssen Sie den Parameter des Modells schätzen. Denken Sie daran, dass dies nicht mehr die vorläufige Schätzung ist.(1)

Bei der Schätzung des Parameters ; verwende ich das Verfahren der nichtlinearen Schätzung, insbesondere den Levenberg-Marquardt-Algorithmus, da MA-Modelle für seinen Parameter nichtlinear sind.θ

Insgesamt kann ich Ihnen sehr empfehlen, Box et al. Zeitreihenanalyse: Prognose und Kontrolle (3. Auflage) .


rk

4

Yt=i=1qϑieti+σet,etiidN(0,1)
q

1
etetq

1
Warum enthält Ihre Formel ein Minus? Normalerweise gilt das Minus für AR-Modelle. Mathematisch ist das kein Thema, ich bin nur gespannt, da ich in MA-Modellen noch nie Minus gesehen habe.
mpiktas

3
et

1
@mpiktas Danke, das gibt einige Hintergrundinformationen zum Fehlerbegriff, aber ich bin mir immer noch nicht sicher, woher der Innovationsprozess kommt. Damit eine Innovation existiert, muss irgendwo eine Prognose erstellt werden ( en.wikipedia.org/wiki/Innovation_ ( Signalverarbeitung)). Is the optimal Y. Prognose einfach E(Y.), das ist der Mittelwert der Serie?
Robert Kubrick

1

Sie sagen "die Beobachtung Y. wird zuerst gegen seine vorherigen Werte regressiert Yt1,...,Ytn and then one or more YY^ values are used as the error terms for the MA model." What I say is that Y is regressed against two predictor series et1 and et2 yielding an error process et which will be uncorrelated for all i=3,4,,,,t .We then have two regression coefficients: θ1 representing the impact of et1 and θ2 representing the impact of et2. Thus et is a white noise random series containing n-2 values. Since we have n-2 estimable relationships we start with the assumption that e1 and e2 are equal to 0.0 . Now for any pair of θ1 and θ2 we can estimate the t-2 residual values. The combination that yields the smallest error sum of squares would then be the best estimates of θ1 and θ2.


What are the 2 other predictor series? I am asking because when I look at the literature I have it's never clearly specified. Are these 2 other series unrelated to Y? I had the impression that all ARIMA formulation is limited to the Y series.
Robert Kubrick

1
The 2 predictors are the lags of the error terms. Since these are not known a priori since we do not know the error terms before we begin is why this has to be treated by non-linear estimation.The confusion you are having is that a model that is finite in the past ( i.e. an AR MODEL ) is potentially infinite in the errors AND a model that is finite in the errors ( i.e. an MA MODEL) is potentially infinite in the past of Y.The reason one selects an AR MODEL versus an MA MODEL is for parsimony. Sometimes we construct an ARMA MODEL which blends both the history of Y and the history of the errors.
IrishStat

1
As I commented in the other answer, what I am still missing is what's the optimal forecast for Y, which is used to calculate the innovation etn.
Robert Kubrick

1

See my post here for an explanation of how to understand the disturbance terms in a MA series.

You need different estimation techniques to estimate them. This is because you cannot first get the residuals of a linear regression and then include the lagged residual values as explanatory variables because the MA process uses the residuals of the current regression. In your example you are making two regression equations and using residuals from one into the other. This is not what an MA process is. It cannot be estimated with OLS.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.