Eine Mitarbeiterin analysiert einige biologische Daten für ihre Dissertation mit böser Heteroskedastizität (Abbildung unten). Sie analysiert es mit einem gemischten Modell, hat aber immer noch Probleme mit den Residuen.
Durch die Protokolltransformation der Antwortvariablen werden die Dinge bereinigt, und basierend auf dem Feedback zu dieser Frage scheint dies ein geeigneter Ansatz zu sein. Ursprünglich hatten wir jedoch gedacht, dass es Probleme bei der Verwendung transformierter Variablen mit gemischten Modellen gibt. Es stellt sich heraus , dass wir eine Erklärung in Littell & Milliken (2006) falsch interpretiert hatte SAS für gemischte Modelle , die wurde unter Hinweis darauf , warum es unangemessen ist , zu transformieren Zahl Daten und dann zu analysieren , mit einem normalen linearen gemischten Modell (full Zitat ist unten) .
Ein Ansatz, der auch die Residuen verbesserte, war die Verwendung eines verallgemeinerten linearen Modells mit einer Poisson-Verteilung. Ich habe gelesen, dass die Poisson-Distribution zum Modellieren kontinuierlicher Daten verwendet werden kann (wie in diesem Beitrag beschrieben ), und Statistikpakete erlauben dies, aber ich verstehe nicht, was passiert, wenn das Modell passt.
Um zu verstehen, wie die zugrunde liegenden Berechnungen durchgeführt werden, lauten meine Fragen: Wenn Sie eine Poisson-Verteilung an kontinuierliche Daten anpassen, 1) werden die Daten auf die nächste ganze Zahl gerundet, 2) geht dabei Informationen verloren, und 3) Wann ist es angemessen, ein Poisson-Modell für kontinuierliche Daten zu verwenden?
Littel & Milliken 2006, S. 529 "Das Transformieren der [count] -Daten kann kontraproduktiv sein. Beispielsweise kann eine Transformation die Verteilung der zufälligen Modelleffekte oder die Linearität des Modells verzerren. Noch wichtiger ist, dass das Transformieren der Daten die Möglichkeit offen lässt Folglich ist die Schlussfolgerung aus einem gemischten Modell unter Verwendung transformierter Daten sehr verdächtig. "