Ich versuche zu verstehen, wie ich eine Variable am besten modellieren kann, wenn ich im Laufe der Zeit immer detailliertere Prädiktoren erhalten habe. Betrachten Sie beispielsweise die Modellierung der Wiederherstellungsraten für ausgefallene Kredite. Angenommen, wir haben einen Datensatz mit Daten aus 20 Jahren, und in den ersten 15 dieser Jahre wissen wir nur, ob das Darlehen besichert war oder nicht, aber nichts über die Merkmale dieser Sicherheiten. In den letzten fünf Jahren können wir die Sicherheiten jedoch in eine Reihe von Kategorien unterteilen, von denen erwartet wird, dass sie einen guten Prädiktor für die Wiederherstellungsrate darstellen.
Angesichts dieses Aufbaus möchte ich ein Modell an die Daten anpassen, Kennzahlen wie die statistische Signifikanz der Prädiktoren bestimmen und dann mit dem Modell prognostizieren.
In welches fehlende Daten-Framework passt das? Gibt es spezielle Überlegungen in Bezug auf die Tatsache, dass die detaillierteren erklärenden Variablen erst nach einem bestimmten Zeitpunkt verfügbar werden, anstatt über die historische Stichprobe verteilt zu sein?