Ich habe eine ziemlich vorhersehbare tägliche Zeitreihe mit wöchentlicher Saisonalität. Ich bin in der Lage, Vorhersagen zu treffen, die ziemlich genau zu sein scheinen (bestätigt durch eine Kreuzvalidierung), wenn es keine Feiertage gibt. In den Ferien habe ich jedoch folgende Probleme:
- In meiner Prognose erhalte ich Zahlen ungleich Null für die Feiertage, obwohl alle historischen Feiertage 0 sind. Dies ist jedoch nicht das Hauptproblem. Das Problem ist ...
- Da die Verarbeitung, die an Feiertagen nicht stattfindet, bis zu den Tagen nach den Feiertagen "überläuft", wird sie von einer einfachen Dummy-Variablen nicht abgeschnitten, da diese Ausreißer kurzfristig innovativ zu sein scheinen. Wenn es keine wöchentliche Saisonalität gäbe, könnte ich vielleicht eine Schätzung für die Verteilung der unverarbeiteten Daten im Urlaub auf die ungefähr fünf Tage nach dem Urlaub ausarbeiten (wie unter Wie werden Variablen erstellt, die die Auswirkung von Urlaub auf Vor- und Nachlauf widerspiegeln). Kalendereffekte in einer Zeitreihenanalyse? ). Die Verteilung des "Überlaufs" hängt jedoch vom Wochentag ab, an dem der Feiertag stattfindet, und davon, ob es sich um Weihnachten oder Erntedankfest handelt, bei denen Bestellungen zu einem niedrigeren Preis als im Rest des Jahres eingehen.
Hier sind einige Momentaufnahmen aus meiner Kreuzvalidierung, die das vorhergesagte (blaue) und das tatsächliche (rote) Ergebnis für Feiertage zeigen, die an verschiedenen Wochentagen angezeigt werden:
Ich mache mir auch Sorgen, dass die Auswirkung von Weihnachten vom Wochentag abhängt, auf den es fällt, und ich habe nur ungefähr sechs Jahre historische Daten.
Hat jemand Vorschläge, wie mit solchen innovativen Ausreißern im Rahmen von Prognosen umgegangen werden kann? (Leider kann ich keine Daten teilen)