Ich habe einen Datensatz über landwirtschaftliche Versuche. Meine Antwortvariable ist ein Antwortverhältnis: log (Behandlung / Kontrolle). Ich bin daran interessiert, was den Unterschied ausmacht, und führe daher RE-Meta-Regressionen durch (ungewichtet, da ziemlich klar ist, dass die Effektgröße nicht mit der Varianz der Schätzungen korreliert).
Jede Studie gibt den Getreideertrag, den Biomasseertrag oder beides an. Ich kann den Getreideertrag nicht aus Studien ableiten, die nur über den Biomasseertrag berichten, da nicht alle untersuchten Pflanzen für Getreide geeignet waren (Zuckerrohr ist zum Beispiel enthalten). Aber jede Pflanze, die Getreide produzierte, hatte auch Biomasse.
Für fehlende Kovariaten verwende ich die iterative Regressionszuschreibung (gemäß dem Lehrbuchkapitel von Andrew Gelman). Es scheint vernünftige Ergebnisse zu liefern, und der gesamte Prozess ist im Allgemeinen intuitiv. Grundsätzlich sage ich fehlende Werte voraus und benutze diese vorhergesagten Werte, um fehlende Werte vorherzusagen, und durchlaufe jede Variable, bis jede Variable ungefähr konvergiert (in der Verteilung).
Gibt es einen Grund, warum ich das gleiche Verfahren nicht verwenden kann, um fehlende Ergebnisdaten zu unterstellen? Ich kann wahrscheinlich ein relativ informatives Imputationsmodell für das Biomasse-Reaktionsverhältnis erstellen, wenn ich das Korn-Reaktionsverhältnis, den Erntetyp und andere Kovariaten, die ich habe, angegeben habe. Ich würde dann die Koeffizienten und VCVs mitteln und die MI-Korrektur gemäß der Standardpraxis hinzufügen.
Aber was messen diese Koeffizienten, wenn die Ergebnisse selbst unterstellt werden? Unterscheidet sich die Interpretation der Koeffizienten vom Standard-MI für Kovariaten? Wenn ich darüber nachdenke, kann ich mich nicht davon überzeugen, dass das nicht funktioniert, aber ich bin mir nicht sicher. Gedanken und Anregungen zum Lesen sind willkommen.