Ich bin beeindruckt vom R- forecast
Paket, sowie zB dem zoo
Paket für unregelmäßige Zeitreihen und Interpolation fehlender Werte.
Meine Anwendung liegt im Bereich der Callcenter-Verkehrsprognose, daher fehlen (fast) immer Daten an den Wochenenden, die gut verarbeitet werden können zoo
. Außerdem können einige diskrete Punkte fehlen, ich benutze einfach Rs NA
dafür.
Die Sache ist: all die schöne Magie des Prognose - Pakets, wie zum Beispiel eta()
, auto.arima()
usw., scheint deutlich zu erwarten ts
Objekte, dh äquidistante Zeitreihe keine fehlenden Daten enthalten. Ich denke, dass reale Anwendungen für Zeitreihen mit gleichem Abstand auf jeden Fall existieren, aber meiner Meinung nach sehr begrenzt.
Das Problem einiger diskreter NA
Werte kann leicht durch Verwendung einer der angebotenen Interpolationsfunktionen in zoo
und durch gelöst werden forecast::interp
. Danach starte ich die Vorhersage.
Meine Fragen:
- Schlägt jemand eine bessere Lösung vor?
(meine Hauptfrage) Zumindest in meiner Anwendungsdomäne, der Callcenter-Verkehrsprognose (und soweit ich mir die meisten anderen Problemdomänen vorstellen kann), sind Zeitreihen nicht gleich verteilt. Zumindest haben wir wiederkehrende "Werktage" oder so. Was ist der beste Weg, um damit umzugehen und trotzdem die coole Magie des Forecast-Pakets zu nutzen?
Sollte ich die Zeitreihen nur "komprimieren", um die Wochenenden zu füllen, die Prognose durchführen und dann die Daten erneut "aufpumpen", um die NA-Werte an den Wochenenden erneut einzufügen? (Das wäre eine Schande, denke ich?)
Gibt es Pläne, das Prognosepaket vollständig mit unregelmäßigen Zeitreihenpaketen wie zoo oder dessen kompatibel zu machen? Wenn ja, wann und wenn nein, warum nicht?
Ich bin ziemlich neu in der Vorhersage (und der Statistik im Allgemeinen), daher kann ich etwas Wichtiges übersehen.
auto.arima
Kann mit fehlenden Werten umgehen.