Das scheint so elementar zu sein, aber ich bleibe immer an diesem Punkt stecken ...
Die meisten Daten, mit denen ich zu tun habe, sind nicht normal, und die meisten Analysen basieren auf einer GLM-Struktur. Für meine aktuelle Analyse habe ich eine Antwortvariable, die "Gehgeschwindigkeit" (Meter / Minute) ist. Es fällt mir leicht zu erkennen, dass ich OLS nicht verwenden kann, aber dann habe ich große Unsicherheit darüber, welche Familie (Gamma, Weibull usw.) geeignet ist!
Ich benutze Stata und sehe mir Diagnosen wie Residuen und Heteroskedastizität, Residuen vs. angepasste Werte usw. an.
Mir ist bekannt, dass Zähldaten die Form einer Rate haben können (z. B. Inzidenzraten) und Gamma (das Analogon zu überdispersen diskreten negativen Binomialmodellen) verwendet haben, aber ich möchte nur, dass eine "rauchende Waffe" JA sagt, SIE HABEN DAS RECHT FAMILIE. Ist die Betrachtung der standardisierten Residuen im Vergleich zu den angepassten Werten der einzige und beste Weg, dies zu tun? Ich möchte ein gemischtes Modell verwenden, um auch eine gewisse Hierarchie in den Daten zu berücksichtigen, muss aber zuerst herausfinden, welche Familie meine Antwortvariable am besten beschreibt.
Jede Hilfe dankbar. Stata-Sprache besonders geschätzt!