Zeitreihenregression mit überlappenden Daten

Ich sehe ein Regressionsmodell, das gegenüber dem Vorjahr rückläufig ist. Die Renditen der Aktienindizes sind verzögert (12 Monate). Die Renditen desselben Aktienindex, Credit Spread (Differenz zwischen dem Monatsmittel der risikofreien Anleihen und Unternehmensanleihen) sind gegenüber dem Vorjahr rückläufig Renditen), Inflationsrate im Jahresvergleich und Jahresindex der Industrieproduktion.

Es sieht so aus (obwohl Sie in diesem Fall die für Indien spezifischen Daten ersetzen würden):

SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +    
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)

SP500YOY ist die Jahresrendite für den SP500-Index. Um dies zu berechnen, wird der monatliche Durchschnitt der SP500-Werte berechnet und dann für jeden Monat in Jahresrenditen umgerechnet (z. B. Jan'10-Jan'11, Feb'10- 11. Februar, 10. März - 11. März, ...). Auf der Seite der erklärenden Variablen wird ein um 12 Monate verzögerter Wert des SP500YOY zusammen mit dem CREDITSPREAD zum Zeitpunkt T und INFLATION und INDUSTRIALPRODUCTION zwei Perioden VORAUS verwendet. Das INFLATIONASYMM ist ein Dummy dafür, ob die Inflation über einem Schwellenwert von 5,0% liegt. Der Index in Klammern zeigt den Zeitindex für jede Variable.

Dies wird durch standardmäßige lineare OLS-Regression geschätzt. Um dieses Modell für die Prognose der Renditen von SP500 für die nächsten 1,2 und 3 Monate zu verwenden, müssen Prognosen für die Inflation und den Index der Industrieproduktion für die nächsten 3,4 und 5 Monate erstellt werden. Diese Vorhersagen werden durchgeführt, nachdem für jedes der beiden Modelle ein ARIMA-Modell individuell angepasst wurde. Die CreditSpread-Prognosen für die nächsten 1,2 und 3 Monate werden nur als mentale Schätzungen herangezogen.

Ich möchte wissen, ob diese lineare OLS-Regression richtig / falsch, effizient / ineffizient oder allgemein gültige statistische Praxis ist.

Das erste Problem, das ich sehe, ist die Verwendung überlappender Daten. Das heißt, die täglichen Werte des Aktienindex werden monatlich gemittelt und dann zur Berechnung der jährlichen Renditen verwendet, die monatlich verschoben werden. Dadurch sollte der Fehlerterm automatisch korreliert werden. Ich würde denken, dass man eine 'Korrektur' in einer der folgenden Zeilen anwenden müsste:

White's heteroskedastisch konsistenter Kovarianzschätzer
Newey & West-Schätzer für Heteroskedastizität und Autokorrelation (HAC)
heteroskedastizitätskonsistente Version von Hansen & Hodrick

Ist es wirklich sinnvoll, eine standardmäßige lineare OLS-Regression (ohne Korrekturen) auf solche überlappenden Daten anzuwenden, und verwenden Sie ARIMA-Vorhersagen mit drei Zeiträumen im Voraus für erklärende Variablen, die in der ursprünglichen linearen OLS-Regression für die Vorhersage von SP500YOY verwendet werden sollen? Ich habe eine solche Form vorher nicht gesehen und kann sie daher nicht wirklich beurteilen, außer wenn ich die Verwendung von überlappenden Beobachtungen korrigiere.

regression time-series autocorrelation

— Vishal Belsare
quelle

Bitte nicht kreuzen .

— Joshua Ulrich

Hier sind einige Artikel, die sich mit diesem Thema befassen:

Britten-Jones und Neuberger, Verbesserte Inferenz und Abschätzung in der Regression mit überlappenden Beobachtungen

Harri & Brorsen, Das überlappende Datenproblem

— R_Coholic
quelle

Aus diesen Unterlagen geht nicht sehr klar hervor, wie diese Korrekturen in der Praxis anzuwenden sind. Gibt es irgendwo eine praktischere Anleitung oder ein Tutorial?

— Machen Sie den

@rinspy Unter quant.stackexchange.com/questions/35216/… finden Sie Code für Hansen & Hodrick

— Candamir,

Können Sie eine Zusammenfassung der Informationen in diesen Artikeln bereitstellen und wie sie die Frage lösen?

— gung - Wiedereinsetzung von Monica