Ich beziehe mich auf diesen Beitrag, der die Bedeutung der Normalverteilung der Residuen in Frage zu stellen scheint, und argumentiere, dass dies zusammen mit der Heteroskedastizität möglicherweise durch die Verwendung robuster Standardfehler vermieden werden könnte.
Ich habe verschiedene Transformationen in Betracht gezogen - Wurzeln, Protokolle usw. - und alles erweist sich als nutzlos, um das Problem vollständig zu lösen.
Hier ist ein QQ-Diagramm meiner Residuen:
Daten
- Abhängige Variable: bereits mit logarithmischer Transformation (behebt Ausreißerprobleme und ein Problem mit der Schiefe in diesen Daten)
- Unabhängige Variablen: Alter der Firma und eine Reihe von binären Variablen (Indikatoren) (Später habe ich einige Zählungen für eine separate Regression als unabhängige Variablen)
Der iqr
Befehl (Hamilton) in Stata bestimmt keine schwerwiegenden Ausreißer, die eine Normalität ausschließen. Die folgende Grafik schlägt jedoch etwas anderes vor, ebenso wie der Shapiro-Wilk-Test.
qenv
Pakets Vertrauensgrenzen hinzufügen .