Mehrere Anrechnungs ist recht einfach , wenn Sie eine haben a - priori - lineares Modell , dass Sie schätzen möchten. Die Dinge scheinen jedoch etwas kniffliger zu sein, wenn Sie tatsächlich ein Modell auswählen möchten (z. B. finden Sie die "beste" Menge von Prädiktorvariablen aus einer größeren Menge von Kandidatenvariablen - ich denke speziell an LASSO und fraktionale Polynome mit R).
Eine Idee wäre, das Modell in die Originaldaten mit fehlenden Werten einzupassen und dieses Modell dann in MI-Datensätzen neu zu schätzen und Schätzungen wie gewohnt zu kombinieren. Dies scheint jedoch problematisch zu sein, da Sie Verzerrungen erwarten (oder warum überhaupt den MI?), Die dazu führen könnten, dass Sie von Anfang an ein "falsches" Modell auswählen.
Eine andere Idee wäre, den in jedem MI-Dataset verwendeten Modellauswahlprozess zu durchlaufen - aber wie würden Sie dann die Ergebnisse kombinieren, wenn sie unterschiedliche Variablensätze enthalten?
Ein Gedanke, den ich hatte, war es, einen Satz von MI-Datensätzen zu stapeln und als einen großen Datensatz zu analysieren, den Sie dann verwenden würden, um ein einzelnes "bestes" Modell anzupassen, und einen Zufallseffekt zu berücksichtigen, für den Sie wiederholte Messungen verwenden jede Beobachtung.
Hört sich das vernünftig an? Oder vielleicht unglaublich naiv? Alle Hinweise zu diesem Thema (Modellauswahl mit Mehrfachzuschreibung) wären sehr dankbar.