Wie man Parameter in GLM mit family = Gamma interpretiert


21

Ich habe eine Frage zur Parameterinterpretation für eine GLM mit einer gamma-verteilten abhängigen Variablen. Dies ist, was R für mein GLM mit einem Log-Link zurückgibt:

Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool, 
    family = Gamma(link = log), data = fakesoep)

Deviance Residuals: 
       Min        1Q    Median        3Q       Max  
  -1.47399  -0.31490  -0.05961   0.18374   1.94176  

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.2202325  0.2182771  28.497  < 2e-16 ***
height       0.0082530  0.0011930   6.918 5.58e-12 ***
age          0.0001786  0.0009345   0.191    0.848    
educat       0.0119425  0.0009816  12.166  < 2e-16 ***
married     -0.0178813  0.0173453  -1.031    0.303    
sex         -0.3179608  0.0216168 -14.709  < 2e-16 ***
language     0.0050755  0.0279452   0.182    0.856    
highschool   0.3466434  0.0167621  20.680  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Gamma family taken to be 0.1747557)

Null deviance: 757.46  on 2999  degrees of freedom
Residual deviance: 502.50  on 2992  degrees of freedom
AIC: 49184

Wie interpretiere ich die Parameter? Wenn ich exp(coef())mein Modell berechne , erhalte ich ~ 500 für den Achsenabschnitt. Nun, ich glaube, das bedeutet nicht das erwartete Einkommen, wenn alle anderen Variablen konstant gehalten werden, oder? Seit dem Durchschnitt oder mean(age)liegt bei ~ 2000. Ich habe außerdem keine Ahnung, wie man die Richtung und den Wert der Koeffizienten der Kovariaten interpretiert.


6
500 wäre in der Nähe des erwarteten Einkommens, wenn alle anderen Variablen genau Null wären (nicht nur konstant) - genau wie bei einer Regression.
Glen_b -Reinstate Monica

@Glen_b Warum wird ein Einkommen erwartet, wenn das Exponential der Koeffizienten der multiplikative Effekt auf das Einkommen ist, wenn sich die erklärende Variable ändert?
Tatami

Der zur Diskussion stehende Fall ist das bedingte Mittel, wenn alle erklärenden Variablen 0 sind.
Glen_b

Antworten:


25

Die logarithmisch verknüpfte Gamma-GLM-Spezifikation ist identisch mit der exponentiellen Regression:

E[y|x,z]=exp(α+βx+γz)=y^

E[y|x=0,z=0]=exp(α)

yxx

E[y|x,z]x=exp(α+βx+γz)β=y^β

xzxzy^βxy

x

E[y|z,x=1]E[y|z,x=0]=exp(α+β+γz)exp(α+γz)=exp(α+γz)(exp(β)1)

x

Die dritte Methode besteht darin, die Koeffizienten zu potenzieren. Beachten Sie, dass:

E[y|z,x+1]=exp(α+β(x+1)+γz)=exp(α+βx+β+γz)=exp(α+βx+γz)exp(β)=E[y|z,x]exp(β)

x


1
Könnten Sie die zweite Interpretation veranschaulichen?
Tatami

@tatami Ich habe einen Fehler im Binärfall behoben. Macht es jetzt mehr Sinn?
Dimitriy V. Masterov

2

Zuerst würde ich mir die Residuen ansehen, um zu sehen, wie gut das Modell passt. Wenn es in Ordnung ist, würde ich versuchen, andere Link-Funktionen zu verwenden, es sei denn, ich hätte Grund zu der Annahme, dass es sich tatsächlich um eine Gamma-Verteilung handelt. Wenn das Gamma immer noch überzeugend aussieht, würde ich zu dem Schluss kommen, dass die statistisch signifikanten Begriffe der Achsenabschnitt, die Größe, die Bildung, das Geschlecht und die Highschool sind (diejenigen, die mit drei Sternen markiert sind). Unter sich kann man nicht mehr sagen, es sei denn, sie sind standardisiert (haben den gleichen Bereich).

Antwort auf Kommentar: Ich verstehe Ihre Frage jetzt besser. Das können Sie auf jeden Fall! Eine Erhöhung der Höhe um eine Einheit führt zu einer exp (0,0082530) -1 ~ = 0,0082530 (unter Verwendung der exp x = 1 + x-Approximation für kleines x) relativen Änderung des Einkommens. Sehr einfach zu interpretieren, nein?


1
Also kann ich die Parameter nicht richtig interpretieren, zB das Einkommen steigt um xy, wenn die Höhe um eins steigt?

1
Ich glaube jetzt, dass ich es multiplikativ interpretieren muss: exp (Intercept) * exp (height) wäre das Einkommen mit einer 1-Einheiten-Erhöhung der Höhe. Trotzdem vielen Dank! :)
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.