Ich würde den Ansatz von Neal et al. Nicht empfehlen . . Ihre Daten sind aus zwei Gründen eindeutig:
Sie arbeiten mit Lebensmitteldaten, die normalerweise dichter und stabiler sind als andere Daten von Einzelhandelsprodukten. Ein bestimmter Standort verkauft Dutzende von Milchkartons oder Eierpackungen pro Woche und verkauft seit Jahrzehnten dieselben Produkte im Vergleich zu Mode- oder Autoteilen, bei denen es nicht ungewöhnlich ist, alle 3 oder 4 Wochen einen einzigen Artikel zu verkaufen. und Daten, die nur für ein oder zwei Jahre verfügbar sind.
Sie prognostizieren für Lagerhäuser, nicht für Geschäfte. Ein einzelnes Lager umfasst mehrere Filialen, sodass deren Daten noch dichter als der Durchschnitt sind. Tatsächlich wird ein Lager normalerweise als natürliche Aggregations- / Gruppierungsebene für Geschäfte verwendet, sodass diese bereits im Wesentlichen eine Gruppierung von Geschäftsdaten durchführen.
Aufgrund der Art ihrer Daten können sie einzelne Zeitreihen direkt modellieren. Die Daten der meisten Einzelhändler wären jedoch auf der Ebene der einzelnen Skus / Geschäfte zu spärlich, als dass sie dies erreichen könnten.
Wie zbicyclist sagte, wird dieses Problem normalerweise mithilfe hierarchischer oder mehrstufiger Prognosen angegangen . Kommerzielle Nachfrageprognosepakete verwenden alle eine Form der hierarchischen Prognose
Die Idee ist, Produkte und Geschäfte in ähnliche Produkte und Regionen zu gruppieren, für die aggregierte Prognosen erstellt und zur Bestimmung der Gesamtsaisonalität und des Trends verwendet werden. Diese werden dann unter Verwendung eines Top-Down-Ansatzes mit den für jede einzelne SKU generierten Basisprognosen abgestimmt / Ladenkombination.
Neben der erwähnten Herausforderung besteht ein größeres Problem darin, dass das Finden der optimalen Gruppierungen von Produkten und Geschäften keine triviale Aufgabe ist, die eine Kombination aus Fachwissen und empirischer Analyse erfordert. Produkte und Geschäfte werden normalerweise in ausgeklügelten Hierarchien zusammengefasst (nach Abteilung, Lieferant, Marke usw. für Produkte, nach Region, Klima, Lager usw. für den Standort), die dann zusammen mit den historischen Verkäufen dem Prognosealgorithmus zugeführt werden Daten selbst.
Adressieren von Merax-Kommentaren
Wie wäre es mit den Methoden des Kaggle-Wettbewerbs Corporación Favorita Grocery Sales Forecasting, bei dem die Modelle aus der Verkaufsgeschichte mehrerer (möglicherweise nicht verwandter) Produkte lernen können, ohne explizite Gruppierungen vorzunehmen? Ist das noch ein gültiger Ansatz?
Sie führen die Gruppierung implizit durch, indem sie Geschäft, Element, Familie, Klasse und Cluster als kategoriale Merkmale verwenden.
Ich habe gerade einen Teil von Rob Hyndmans Abschnitt über hierarchische Prognosen gelesen. Es scheint mir, dass ein Top-Down-Ansatz verlässliche Prognosen für die aggregierten Ebenen liefert. Es hat jedoch den großen Nachteil, dass Informationen aufgrund von Aggregation verloren gehen, was sich auf Prognosen für die Knoten der untersten Ebene auswirken kann. Es kann auch "nicht in der Lage sein, einzelne Serienmerkmale wie Zeitdynamik, besondere Ereignisse zu erfassen und zu nutzen".
Drei Punkte dazu:
- Der Nachteil, auf den er hinweist, hängt von der Gruppierung der Daten ab. Wenn Sie alle Produkte und Geschäfte zusammenfassen, ist dies ein Problem. Wenn Sie beispielsweise alle Geschäfte aus allen Regionen zusammenfassen, werden alle regionenspezifischen Saisonalitäten verwischt. Sie sollten jedoch nur bis zur relevanten Gruppierung aggregieren, und wie ich bereits erwähnt habe, erfordert dies einige Analysen und Experimente, um sie zu finden.
- Im speziellen Fall der Einzelhandelsnachfrage sind wir nicht besorgt über "Verlust von Informationen aufgrund von Aggregation", da die Zeitreihen an den unteren Knoten (dh SKU / Store) häufig nur sehr wenige Informationen enthalten, weshalb wir sie bis zu den höheren aggregieren Ebenen in erster Linie.
- Bei SKU / Store-spezifischen Ereignissen gehen wir in meinem Team so vor, dass die ereignisspezifischen Effekte vor dem Generieren einer Prognose entfernt und später nach dem Generieren der Prognose wieder hinzugefügt werden. Siehe hier für Details.