Ist es für eine lineare Regression mit mehreren Gruppen (natürliche Gruppen, die a priori definiert wurden) akzeptabel, zwei verschiedene Modelle mit demselben Datensatz auszuführen, um die folgenden zwei Fragen zu beantworten?
Hat jede Gruppe eine Steigung ungleich Null und einen Achsenabschnitt ungleich Null und welche Parameter gibt es für jede Gruppe innerhalb der Gruppenregression?
Gibt es unabhängig von der Gruppenmitgliedschaft einen Nicht-Null-Trend und einen Nicht-Null-Achsenabschnitt und welche Parameter gibt es für die gruppenübergreifende Regression?
In R wäre das erste Modell lm(y ~ group + x:group - 1)
, so dass die geschätzten Koeffizienten direkt als Achsenabschnitt und Steigung für jede Gruppe interpretiert werden könnten. Das zweite Modell wäre lm(y ~ x + 1)
.
Die Alternative wäre lm(y ~ x + group + x:group + 1)
, was zu einer komplizierten Übersichtstabelle von Koeffizienten führt, wobei innerhalb der Gruppe Steigungen und Abschnitte aus den Unterschieden in Steigungen und Abschnitten aus einer Referenz berechnet werden müssen. Außerdem müssen Sie die Gruppen neu anordnen und das Modell ohnehin ein zweites Mal ausführen, um (manchmal) einen p-Wert für die letzte Gruppendifferenz zu erhalten.
Beeinflusst die Verwendung von zwei getrennten Modellen die Inferenz in irgendeiner Weise oder diese Standardpraxis?
Um dies in einen Zusammenhang zu bringen, betrachten Sie x als Medikamentendosis und die Gruppen als verschiedene Rassen. Es kann interessant sein, die Dosis-Wirkungs-Beziehung für eine bestimmte Rasse für einen Arzt zu kennen oder für welche Rassen das Medikament überhaupt wirkt, aber es kann manchmal auch interessant sein, die Dosis-Wirkungs-Beziehung für die gesamte (menschliche) Bevölkerung zu kennen unabhängig von der Rasse für einen Beamten des öffentlichen Gesundheitswesens. Dies ist nur ein Beispiel dafür, wie man sich sowohl innerhalb einer Gruppe als auch zwischen Gruppenregressionen getrennt interessieren könnte. Ob eine Dosis-Wirkungs-Beziehung linear sein sollte, ist nicht wichtig.