Was ist der beste Weg, um Zeitreihendaten in Zug- / Test- / Validierungssätze aufzuteilen, wobei der Validierungssatz für die Optimierung von Hyperparametern verwendet wird?
Wir haben tägliche Verkaufsdaten im Wert von 3 Jahren. Unser Plan ist es, 2015-2016 als Trainingsdaten zu verwenden, dann 10 Wochen aus den 2017-Daten, die als Validierungssatz verwendet werden sollen, und weitere 10 Wochen ab 2017-Daten für zufällig auszuwählen das Testset. Wir werden dann an jedem der Tage im Test- und Validierungssatz einen Spaziergang vorwärts machen.