Vorhersage nichtstationärer Zeitreihen

Ich möchte die instationären Zeitreihen vorhersagen, die mehrere wichtige a-priori-Annahmen beinhalten, die sich aus der Untersuchung von Instanzen solcher Reihen ergeben.

Ich habe eine zeitgemittelte Ein-Punkt-Wahrscheinlichkeitsverteilungsfunktion konstruiert, die durch die Normalverteilung angenähert wird. Unter diesem Gesichtspunkt möchte ich, dass die Prognosenicht überschreitet, wenn. Mit anderen Worten muss die Varianz vonbegrenzt werden.
$\hat{p} (x) = \frac{1}{\sqrt{2 π σ_{\infty}^{2}}} \exp (- \frac{x^{2}}{2 σ_{\infty}^{2}})$ $\hat p(x) = \frac{1}{\sqrt{2\pi \sigma^2_{\infty}}} \exp\left(-\frac{x^2}{2\sigma^2_{\infty}}\right)$ $z_t(l)$ $l \to \infty$ $z_t(l)$
Die durchschnittliche Zweipunktwahrscheinlichkeitsverteilungsfunktion ebenfalls konstruiert, was zur Identifizierung der Autokorrelationsfunktion führte. lieferte . $\hat p(x_i,i;x_j,j)$ $\rho(j) \approx A j^{-\alpha}$ $0<\alpha<0.5$

Der Identifizierungsprozess von Box-Jenkins führte mich jedoch zunächst zum -Modell $ARIMA(0,1,3)$

Ich kann die Varianz nicht bis (was sich aus Gleichungen für BJ-Gewichte ). Gleichzeitig kann ich nicht verwenden, da die anfängliche Autokorrelation langsam abnimmt (was laut BJ wahrscheinlich ein Beweis für Nichtstationarität ist). Dies ist das Haupthindernis für mich. $d \ne 0$ $\psi_j$ $d=0$
Visuell stimmt die Simulation von nicht mit dem Verhalten meiner Proben überein. Und Korrelationen der ersten Differenz der Reihe stimmen schlecht mit den aus dem Modell folgenden Korrelationen überein. $ARIMA(0,1,3)$
Die Analyse der Residuen zeigt signifikante Korrelationen ab Verzögerung 3. Aus diesem Grund ist meine anfängliche Aussage zu falsch. $ARIMA(0,1,3)$

Der Versuch , unterschiedliche passen Modelle, wie ich sehe , dass es nahe der Verzögerung signifikant Residualkorrelationen ist für jeden . Es kann davon ausgegangen werden, dass ich ein Modell (als einschränkende Auswahl) benötige , zum Beispiel gebrochenes ARIMA. $ARIMA(p,0,0)$ $p$ $p$ $ARIMA(\infty,0,q)$

Aus [1] habe ich etwas über fraktionierte Modelle gelernt die . $ARIMA(p,d,q)$ $ARIMA(\infty,0,q)$

Ich habe keine GNU R-Pakete gefunden, die fehlende Werte dafür unterstützen. Fehlende Werte scheinen eine Art Herausforderung zu sein.
Die Veröffentlichungen zu fraktioniertem ARIMA sind ziemlich selten. Werden solche Bruchmodelle wirklich verwendet? Vielleicht gibt es einen guten Ersatz für ARIMA-Modelle für meine Bedürfnisse? Die Prognose ist nicht mein Hauptfach, ich habe nur pragmatisches Interesse.
Aus verschiedenen Literaturstellen (zum Beispiel [2]) habe ich gelernt, dass es praktisch unmöglich ist, sich zwischen fraktioniertem ARIMA und Modellen mit "Pegelverschiebung" zu entscheiden. Ich habe jedoch nicht das Paket für GNU R gefunden, das für Level-Shift-Modelle geeignet ist.

_{[1]: Granger, Joyeux.: J. von Zeitreihen anal. vol. 1 nr. 1 1980, S.15}

[2]: Grassi, de Magistris.: "Wenn langes Gedächtnis auf den Kalman-Filter trifft: Eine vergleichende Studie", Computational Statistics and Data Analysis, 2012, im Druck.

Update: um meinen eigenen Fortschritt zu rendern und @IrishStat zu beantworten

Meine Aussage zur Zweipunktwahrscheinlichkeitsverteilung ist im Allgemeinen falsch. Die auf diese Weise konstruierte Funktion hängt von der vollen Serienlänge ab. Es gibt also ein wenig zu extrahieren. Zumindest hängt der Parameter von der vollen Serienlänge ab. $\alpha$

Die Listen 2 und 3 wurden ebenfalls aktualisiert.

Meine Daten sind als dat - Datei zur Verfügung hier .

Im Moment bezweifle ich zwischen FARIMA und Pegelverschiebungen, und ich kann immer noch keine geeignete Software finden, um diese Optionen zu überprüfen. Dies ist auch meine erste Erfahrung mit der Modellidentifikation, daher wird jede Hilfe geschätzt.

time-series forecasting arima

— 0x2207
quelle

Ich bin ein bisschen verwirrt von Ihren Daten. Zum Beispiel, was ist die Bedeutung von 6325.76 ... und -.247831. Was wird beobachtet? Sind die Daten chronologisch und zeitlich gleich verteilt? 6325,76666666667 -,247831949032426 „770“ 6326,78333333333 0,0282060159445925 „771“ 6327,78333333333 0,162348034962085 „772“ 6328,78333333333 -,206057978534193 „773“ 6329,78333333333 -,427928912063427 „774“ 6330,78333333333 NA „775“ 6331,78333333333 NA „776“ 6332,78333333333 NA „777“ 6333,78333333333 NA „778“ NA 6334,78333333333

— IrishStat

Dies ist das Ergebnis von write.table (). Die erste Spalte ist "Zeilenname" (bedeutungslos), die zweite ist der Zeitpunkt, der dritte Wert. Es sind fast gleich große Beobachtungen, viele Daten fehlen.

— 0x2207

Zeitbereichsansätze erfordern Daten mit gleichem Abstand, ohne dass Werte fehlen. Aus pädagogischen Gründen werde ich eine Teilmenge der Daten nehmen UND davon ausgehen, dass sie gleichmäßig verteilt sind, und versuchen, sie zu charakterisieren.

— IrishStat

Ich habe noch nie ein Modell wie Box-Jenkins gesehen. Der Identifizierungsprozess führte mich zum ARIMA (0,1,3) -Modell, aber ich hatte noch nie einen schwarzen Schwan gesehen, bis ich nach Australien ging. Bitte posten Sie Ihre Daten, da dies möglicherweise auf die Notwendigkeit hinweist

Interventionserkennung, die zu Pegelverschiebungen, lokalen Zeittrends et al
Zeitvariable Parameter
Zeitvariable Fehlervarianz

Wenn Ihre Daten vertraulich sind, skalieren Sie sie einfach.

OK, nachdem ich Ihre Daten erhalten habe (ca. 80000 Messwerte), habe ich ab Punkt 6287 805 Beobachtungen ausgewählt und erhalten.

Geben Sie hier die Bildbeschreibung ein . In Periode 137 wurde ein signifikanter Änderungspunkt festgestellt, was auf zeitlich veränderliche Parameter hindeutet. Die verbleibenden 668 Beobachtungen deuten auf ein pdq-ARIMA-Modell (3,0,0) mit einer Stufenverschiebung hin, das Ihre vorläufigen Schlussfolgerungen zu Verzögerung 3 stützt Geben Sie hier die Bildbeschreibung ein . Das Diagramm "Ist / Anpassung / Prognose" ist das Residuendiagramm und der ACF der Residuen ist . Da der ACF der Residuen in den Perioden 5 und 10 eine starke Struktur aufweist, können Sie die saisonale Struktur in Lag 5 weiter untersuchen. Ich hoffe, dies hilft.

— IrishStat
quelle