Derzeit arbeite ich an einem Projekt zur Vorhersage von Zeitreihendaten (monatliche Daten). Ich benutze R, um die Vorhersage zu machen. Ich habe 1 abhängige Variable (y) und 3 unabhängige Variablen (x1, x2, x3). Die y-Variable hat 73 Beobachtungen, ebenso wie die anderen 3 Variablen (auch 73). Von Januar 2009 bis Januar 2015. Ich habe Korrelationen und den p-Wert überprüft, und es ist alles wichtig, ihn in ein Modell einzufügen. Meine Frage ist: Wie kann ich mit allen unabhängigen Variablen eine gute Vorhersage treffen? Ich habe keine zukünftigen Werte für diese Variablen. Nehmen wir an, ich möchte vorhersagen, was meine y-Variable in mehr als 2 Jahren (2017) ist. Wie kann ich das machen?
Ich habe den folgenden Code ausprobiert:
model = arima(y, order(0,2,0), xreg = externaldata)
Kann ich mit diesem Code eine Vorhersage des y-Werts über 2 Jahre machen?
Ich habe auch einen Regressionscode ausprobiert:
reg = lm(y ~ x1 + x2 + x3)
Aber wie nehme ich mir die Zeit in diesem Code? Wie kann ich vorhersagen, wie hoch mein y-Wert sein wird, sagen wir 2 Jahre? Ich bin neu in Statistik und Prognose. Ich habe etwas gelesen und über den Verzögerungswert hinweg gearbeitet, aber wie kann ich einen Verzögerungswert im Modell verwenden, um Prognosen zu erstellen?
Eigentlich ist meine allgemeine Frage, wie ich Zeitreihendaten mit externen Variablen ohne zukünftigen Wert vorhersagen kann.