Ich habe einen medizinischen Datensatz mit ca. 200 Variablen. Eine der Variablen ist ein Bio-Marker (Konzentration eines bestimmten Enzyms). Die Verteilung ist recht schief und das Problem ist, dass Werte über einem bestimmten Level auf diesem Level zensiert / abgeschnitten werden. Während der Mittelwert der Variablen bei 10 liegt, werden alle Werte größer als 50 als 50 aufgezeichnet.
Ich möchte fortlaufende Werte für diese zensierten Werte unterstellen. Ich verwende derzeit mehrere Imputationen mit dem Mäusepaket in R, obwohl mir andere Systeme zur Verfügung stehen und ich offen für andere Ansätze bin. Ein Gedanke, den ich hatte, war, all diese zensierten Werte als fehlend neu zu kodieren und dann die Imputationen auszuführen. Wenn einer der ursprünglich zensierten unterstellten Werte unter dem Grenzwert liegt, wird er als Grenzwert zugewiesen.
Ich würde gerne Meinungen dazu und / oder bessere Methoden zum Umgang damit erfahren.