Google Trends gibt wöchentliche Daten zurück, daher muss ich einen Weg finden, diese mit meinen täglichen / monatlichen Daten zusammenzuführen.
Was ich bisher getan habe, ist, jede Serie in tägliche Daten aufzuteilen, zum Beispiel:
von:
2013-03-03 - 2013-03-09 37
zu:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
Dies erhöht jedoch die Komplexität meines Problems. Ich habe versucht, Google-Suchanfragen aus den Werten der letzten 6 Monate oder 6 Werten in monatlichen Daten vorherzusagen. Tägliche Daten würden eine Arbeit an 180 vergangenen Werten implizieren. (Ich habe 10 Jahre Daten, also 120 Punkte in monatlichen Daten / 500+ in wöchentlichen Daten / 3500+ in täglichen Daten)
Der andere Ansatz wäre, tägliche Daten in wöchentlichen / monatlichen Daten "zusammenzuführen". Aus diesem Prozess ergeben sich jedoch einige Fragen. Einige Daten können gemittelt werden, weil ihre Summe etwas darstellt. Niederschlag Zum Beispiel ist die Regenmenge in einer bestimmten Woche die Summe der Mengen für jeden Tag, aus dem die Wochen bestehen.
In meinem Fall beschäftige ich mich mit Preisen, Finanzraten und anderen Dingen. Bei den Preisen ist es in meinem Bereich üblich, das ausgetauschte Volumen zu berücksichtigen, sodass die wöchentlichen Daten ein gewichteter Durchschnitt sind. Für finanzielle Zinssätze ist es etwas komplexer, da einige Formeln verwendet werden, um wöchentliche Zinssätze aus täglichen Zinssätzen zu erstellen. Für die anderen Dinge kenne ich die zugrunde liegenden Eigenschaften nicht. Ich denke, diese Eigenschaften sind wichtig, um bedeutungslose Indikatoren zu vermeiden (ein Durchschnitt der Verlobungsraten wäre zum Beispiel unsinnig).
Also drei Fragen:
Wie soll ich bei bekannten und unbekannten Eigenschaften von täglichen zu wöchentlichen / monatlichen Daten übergehen?
Ich habe das Gefühl, dass es etwas falsch ist, wöchentliche / monatliche Daten in tägliche Daten aufzuteilen, wie ich es getan habe, weil ich Mengen einführe, die im wirklichen Leben keinen Sinn haben. Also fast die gleiche Frage:
Wie soll ich bei bekannten und unbekannten Eigenschaften von wöchentlichen / monatlichen zu täglichen Daten wechseln?
Last but not least: Was ist besser, wenn zwei Zeitreihen mit unterschiedlichen Zeitschritten angegeben werden: Den niedrigsten oder den größten Zeitschritt verwenden? Ich denke, dies ist ein Kompromiss zwischen der Anzahl der Daten und der Komplexität des Modells, aber ich sehe kein starkes Argument, um zwischen diesen Optionen zu wählen.
Bearbeiten: Wenn Sie ein Tool (in R Python sogar Excel) kennen, um es einfach zu machen, wäre es sehr dankbar.