Angenommen, ich habe eine Gruppe von erklärenden Variablen für i = 1 . . . N , t = 1 . . . T sowie ein Vektor von binären Ergebnis abhängigen Variablen Y i T . So Y wird erst in der letzten Zeit beobachtet T und nicht zu einem frühen Zeitpunkt. Der ganz allgemeine Fall ist, zu jeder Zeit t für jede Einheit i mehrere X i j t für j = 1 ... K zu haben, aber konzentrieren wir uns der Kürze halber auf den Fall .
Anwendungen solcher "unausgeglichenen" Paare mit zeitlich korrelierten erklärenden Variablen sind zB (tägliche Aktienkurse, vierteljährliche Dividenden), (tägliche Wetterberichte, jährliche Wirbelstürme) oder (Schachpositionsmerkmale nach jedem Zug, Gewinn / Verlust-Ergebnis bei das Ende des Spiels).
Ich interessiere mich für die (möglicherweise nichtlinearen) Regressionskoeffizienten zur Vorhersage von Y i t , da ich weiß, dass in den Trainingsdaten bei frühzeitigen Beobachtungen von X i t für t < T das Endergebnis Y i T resultiert
Vor dem Hintergrund der Ökonometrie habe ich nicht viel Regressionsmodellierung gesehen, die auf solche Daten angewendet wurde. OTOH, ich habe die folgenden Techniken des maschinellen Lernens gesehen, die auf solche Daten angewendet werden:
- dabei überwachtes Lernen auf dem gesamten Datensatz, zB Minimierungs
durch einfaches Extrapolieren / Zurechnen des beobachteten zu allen vorherigen Zeitpunkten
Dies fühlt sich "falsch" an, da die zeitliche Korrelation zwischen den verschiedenen Zeitpunkten nicht berücksichtigt wird.
- dabei Verstärkung Lernen , wie Temporal-Differenz mit Parameterlern und reduzierten Parametern λ , und die Lösung von rekursiv für β t durch Rückausbreitung ausgehend von t =
mit weiterempfehlen der Gradient von f ( ) in Bezug auf .
Dies scheint "korrekter" zu sein, da es die zeitliche Struktur berücksichtigt, aber die Parameter und & lgr; sind eine Art "ad hoc".
Frage : Gibt es Literatur darüber, wie die oben genannten Techniken des überwachten / verstärkten Lernens in einem Regressionsrahmen abgebildet werden können, wie er in der klassischen Statistik / Ökonometrie verwendet wird? Insbesondere möchte ich in der Lage sein, die Parameter auf einmal zu schätzen (dh für alle t = gleichzeitig)indem (nichtlineare) Least-Squares oder Maximum-Likelihood auf Modellen wie z wie
Mich würde auch interessieren, ob der zeitliche Unterschied Lernmetaparameter undaus einer Maximum-Likelihood-Formulierung wiederhergestellt werden könnten.