Ich habe einen Datensatz, der sich mit Einwanderungsanträgen und Visumannahmen (Erteilung von Visa) befasst. Die Preise werden für "akzeptiert" und "abgelehnt" von Visumanträgen berechnet.
Der Datensatz enthält jedoch auch Werte für Fälle, die geschlossen wurden. Normalerweise ist dies der Fall, wenn der Einwanderer entweder nicht mehr zu Terminen erscheint, woanders hinwandert oder stirbt. Da diese Zahlen bei der Berechnung der Tarife nicht verwendet werden, werden die Tarife häufig als fehlend angezeigt (da die Fälle weder akzeptiert noch abgelehnt wurden).
Wenn die einzigen Fälle für dieses Jahr "ansonsten abgeschlossen" wären, wäre es dann jemals in Ordnung, diese Beobachtungen fallen zu lassen? Ein Teil des Problems, das ich habe, ist, dass zufällige Jahre im Datensatz gelöscht werden, da die einzigen Entscheidungen für dieses Jahr geschlossen wurden.
Die ansonsten abgeschlossenen Fälle sind sehr willkürlich, und wie ich bereits erwähnt habe, handelt es sich höchstwahrscheinlich um Fälle, in denen der Einwanderer an einen anderen Ort eingewandert ist und wahrscheinlich nur das erste Land als vorübergehenden Transitort genutzt hat. Die Daten sagen nicht ausdrücklich aus, warum die Einwanderer gegangen sind, warum sie geschlossen wurden usw. Ich bin mir nicht sicher, wie ich mit diesen fehlenden Werten umgehen soll. Ich glaube nicht, dass Standard-Imputationsmethoden hier aufgrund der Ratenberechnungen funktionieren würden (aber ich könnte mich irren).