Gibt es einen Goldstandard für die Modellierung von Zeitreihen mit unregelmäßigen Abständen?


45

Im Bereich der Ökonomie (glaube ich) gibt es ARIMA und GARCH für regelmäßig verteilte Zeitreihen und Poisson, Hawkes für die Modellierung von Punktprozessen. Wie wäre es also mit Versuchen, unregelmäßig (ungleichmäßig) verteilte Zeitreihen zu modellieren - gibt es (zumindest) gängige Vorgehensweisen ?

(Wenn Sie etwas über dieses Thema wissen, können Sie auch den entsprechenden Wiki-Artikel erweitern .)

Ausgabe (über fehlende Werte und unregelmäßige Zeitreihen):

Antworte auf @Lucas Reis Kommentar. Wenn aufgrund des Poisson-Prozesses Lücken zwischen den Mess- oder Realisierungsvariablen vorhanden sind, ist für diese Art der Regularisierung nicht viel Platz. Es gibt jedoch ein einfaches Verfahren: Ist t(i)der i-te Zeitindex der Variablen x (i-ter Zeitindex von Realisierung x), dann Lücken zwischen den Zeiten der Messungen definieren g(i)=t(i)-t(i-1), dann diskretisieren wir g(i)mit konstant c, dg(i)=floor(g(i)/cund neuer Zeitreihe erstellen mit der Anzahl der Leerwerte zwischen alten Beobachtungen von den ursprünglichen Zeitreihen iund i+1gleich (i dg), aber das Problem ist , dass diese Verfahren können leicht Zeitreihen mit einer Anzahl fehlender Daten erzeugen, die viel größer als die Anzahl der Beobachtungen ist, so dass die vernünftige Schätzung der Werte fehlender Beobachtungen unmöglich und zu groß sein könntec"Zeitstruktur / Zeitabhängigkeit etc." streichen des analysierten Problems (Extremfall ist gegeben, wenn c>=max(floor(g(i)/c))einfach unregelmäßig verteilte Zeitreihen in regelmäßig verteilte zusammengefasst werden

Edition2 (nur zum Spaß): Bild, das fehlende Werte in unregelmäßig verteilten Zeitreihen oder sogar bei Punktprozessen berücksichtigt.


Nur um zu verdeutlichen, wenn Sie "unregelmäßig" sagen, meinen Sie nicht "regelmäßig, aber mit fehlenden Werten", richtig?
Wayne

2
Nein :) t(i)- Zeit x[t(i)],x[t(i+1)],x[t(i+2)]...und t(j+1)-t(j)nicht konstant. Die Daten werden in einem verteilten oder asynchronen Verfahren gesammelt.
Qbik


2
Was ist mit der Interpolation und der Durchführung der Analyse mit den interpolierten Werten in regelmäßigen Abständen? Weiß jemand, was die Implikationen dieser Methode sein würden?
Lucas Reis

Was ist mit der ersten Modellierung der Zeiten der Punkte und dann der Werte der Punkte, abhängig von ihrer Zeit? Ich glaube, dass "markierte Punktprozesse" der Begriff sind.
PeterR

Antworten:


26

Wenn die Beobachtungen eines stochastischen Prozesses unregelmäßig verteilt sind, ist die natürlichste Art, die Beobachtungen zu modellieren, die zeitdiskrete Beobachtung eines kontinuierlichen Zeitprozesses.

Für eine Modellspezifikation wird im Allgemeinen die gemeinsame Verteilung der Beobachtungen die zu den Zeitpunkten , benötigt, und dies kann zum Beispiel in bedingte Verteilungen von zerlegt werden mit . Wenn der Prozess ein Markov-Prozess ist, hängt diese bedingte Verteilung von nicht von und von und . Wenn der Prozess zeithomogen ist, ist die Abhängigkeit von den Zeitpunkten nur durch ihre Differenz .X1,,Xnt1<t2<<tnXiXi1,,X1Xi1 Xi2,,X1 titi1titi1

Wir sehen daraus, dass wir, wenn wir äquidistante Beobachtungen (mit ) von einem zeithomogenen Markov-Prozess haben, nur eine einzige bedingte Wahrscheinlichkeitsverteilung angeben müssen, um a anzugeben Modell. Andernfalls müssen wir eine ganze Sammlung von bedingten Wahrscheinlichkeitsverteilungen angeben, die durch die Zeitdifferenzen der Beobachtungen indiziert sind, um ein Modell anzugeben. Letzteres ist in der Tat am einfachsten durch Spezifizieren einer Familie kontinuierlicher zeitbedingter Wahrscheinlichkeitsverteilungen zu erreichen.titi1=1P1Ptiti1Pt

Ein üblicher Weg, um eine kontinuierliche zu erhalten, ist durch eine stochastische Differentialgleichung (SDE) Ein guter Einstieg in die Statistik für SDE-Modelle ist Simulation and Inference for Stochastic Differential Equations von Stefano Iacus. Es kann sein, dass viele Methoden und Ergebnisse für Beobachtungen mit gleichem Abstand beschrieben werden, dies ist jedoch in der Regel nur für die Darstellung zweckmäßig und für die Anwendung nicht unbedingt erforderlich. Ein Haupthindernis ist, dass die SDE-Spezifikation bei diskreten Beobachtungen selten eine explizite Wahrscheinlichkeit zulässt, aber es gibt gut entwickelte Alternativen für Schätzgleichungen.

dXt=a(Xt)dt+b(Xt)dBt.

Wenn Sie über Markov-Prozesse hinausgehen möchten, ähneln die stochastischen Volatilitätsmodelle (G) ARCH-Modellen, die versuchen, eine heterogene Varianz (Volatilität) zu modellieren. Man kann auch Verzögerungsgleichungen wie , die zeitkontinuierliche Analoga von AR -Prozessen sind. ( p )

dXt=0ta(s)(XtXs)ds+σdBt
(p)

Ich denke, man kann mit Recht sagen, dass es bei Beobachtungen zu unregelmäßigen Zeitpunkten üblich ist, ein kontinuierliches zeitstochastisches Modell aufzubauen.


1
GARCH ist kein stochastischer Volatilitätsprozess. Das Volumen in GARCH wird für diesen Zeitraum vollständig durch die Beobachtungen in den Vorperioden bestimmt.
Aksakal

11

Für unregelmäßig verteilte Zeitreihen ist es einfach, einen Kalman-Filter zu konstruieren .

Es ist ein Papier , wie ARIMA in Zustandsraumform übertragen hier

Und ein Artikel, der Kalman mit GARCH vergleicht, hier(1)

(1) Choudhry, Taufiq und Wu, Hao (2008)
Prognosefähigkeit der GARCH-vs.-Kalman-Filtermethode: Evidenz aus dem täglichen zeitvariablen Beta in Großbritannien.
Journal of Forecasting , 27, (8), 670 & ndash; 689. (doi: 10.1002 / for.1096).


Entschuldigung, ich habe keinen Zugang zu dem letzten Artikel. Könnten Sie mir bitte helfen?
Quarz

2
Ich habe das Zitat hinzugefügt, damit es leicht zu finden ist - es gibt auch einen Preprint hier: eprints.soton.ac.uk/147383
bdecaf

Das Papier über die Übertragung von ARIMA in den Zustandsraum scheint eine fehlerhafte Verknüpfung zu haben.
ofey73

9

Als ich nach einer Möglichkeit suchte, das Ausmaß der Fluktuation in Daten mit unregelmäßigen Stichproben zu messen, stieß ich auf diese beiden Artikel zur exponentiellen Glättung für unregelmäßige Daten von Cipra [ 1 , 2 ]. Diese bauen weiter auf den Glättungstechniken von Brown, Winters und Holt (siehe Wikipedia-Eintrag für Exponential Smoothing ) und auf einer anderen Methode von Wright (siehe Papier für Referenzen) auf. Diese Methoden setzen nicht viel über den zugrunde liegenden Prozess voraus und funktionieren auch für Daten, die saisonale Schwankungen aufweisen.

Ich weiß nicht, ob irgendetwas davon als "Goldstandard" gilt. Für meinen eigenen Zweck habe ich mich für die Zwei-Wege-Glättung nach Brown entschieden. Ich hatte die Idee, die Zusammenfassung auf zwei Arten zu glätten, indem ich sie in eine studentische Arbeit lese (die ich jetzt nicht finde).


7

Die Analyse von unregelmäßig abgetasteten Zeitreihen kann schwierig sein, da nicht viele Tools zur Verfügung stehen. Manchmal besteht die Praxis darin, regelmäßige Algorithmen anzuwenden und auf das Beste zu hoffen. Dies ist nicht unbedingt der beste Ansatz. In anderen Fällen wird versucht, die Daten in den Lücken zu interpolieren. Ich habe sogar Fälle gesehen, in denen Lücken mit Zufallszahlen gefüllt sind, die die gleiche Verteilung wie die bekannten Daten haben. Ein Algorithmus speziell für unregelmäßig abgetastete Zeitreihen ist das Lomb-Scargle-Periodogramm, das ein Periodogramm (Think-Power-Spektrum) für ungleichmäßig abgetastete Zeitreihen liefert. Lomb-Scargle benötigt keine "Gap-Konditionierung".


3

Wenn Sie ein "lokales" Zeitbereichsmodell wünschen - im Gegensatz zum Schätzen von Korrelationsfunktionen oder Leistungsspektren), um beispielsweise transiente Impulse, Sprünge und dergleichen zu erkennen und zu charakterisieren, kann der Bayes'sche Block-Algorithmus nützlich sein. Es bietet eine optimale stückweise konstante Darstellung von Zeitreihen in jedem Datenmodus und mit willkürlichen (ungleichmäßig) verteilten Abtastungen. Sehen

"Studien zur astronomischen Zeitreihenanalyse. VI. Bayesian Block Representations", Scargle, Jeffrey D .; Norris, Jay P .; Jackson, Brad; Chiang, James, Astrophysical Journal, Band 764, 167, 26 S. (2013). http://arxiv.org/abs/1207.5578


2

RJMartin, "Unregelmäßig abgetastete Signale: Theorien und Techniken zur Analyse", Dissertation, UCL, 1998, online verfügbar. Kapitel 4 befasst sich mit autoregressiven Modellen und entwickelt das Thema aus der Perspektive der kontinuierlichen Zeit, wie andere Beiträge bereits sagten.


1

Abschnitt 4.10 von J.Durbin, SJKoopman, Zeitreihenanalyse nach Zustandsraummethoden , 2. Auflage, 2012, widmet sich der Modellierung unter den Umständen fehlender Beobachtungen.


1

In der Geodatenanalyse werden Daten meist unregelmäßig im Raum abgetastet. Eine Idee wäre also, zu sehen, was dort gemacht wird, und Variogrammschätzung, Kriging usw. für eine eindimensionale "Zeit" -Domäne zu implementieren. Variogramme könnten auch für regelmäßig verteilte Zeitreihendaten interessant sein, da sie andere Eigenschaften als die Autokorrelationsfunktion aufweisen und selbst für instationäre Daten definiert und aussagekräftig sind.

Hier ist eine Zeitung (auf Spanisch) und hier eine andere.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.