Wie interpretiere ich ein Probit-Modell in Stata?


13

Ich bin nicht sicher, wie ich diese Probit-Regression interpretieren soll, die ich für Stata durchgeführt habe. Die Daten befinden sich in der Kreditgenehmigung und Weiß ist eine Dummy-Variable, die = 1 ist, wenn eine Person weiß war, und = 0 ist, wenn die Person nicht weiß war. Jede Hilfe zum Lesen wäre sehr dankbar. Was ich hauptsächlich suche, ist, wie man die geschätzte Wahrscheinlichkeit der Darlehensgenehmigung für Weiße und Nichtweiße findet. Kann mir jemand auch bei dem Text weiterhelfen und wie man es normal macht ??? Es tut mir leid, dass ich nicht weiß, wie ich das machen soll.

. probit approve white

Iteration 0:   log likelihood = -740.34659  
Iteration 1:   log likelihood = -701.33221  
Iteration 2:   log likelihood = -700.87747  
Iteration 3:   log likelihood = -700.87744  

Probit regression                                 
Number of obs   =       1989

LR chi2(1)      =      78.94

Prob > chi2     =     0.0000

Log likelihood = -700.87744                       

Pseudo R2       =     0.0533

für die Variable weiß:

Coef.: .7839465  
Std. Err.: .0867118  
z: 9.04  
P>|z|: 0.000  
95% Conf. Interval: .6139946-.9538985  

für die Konstante:

Coef.: .5469463  
Std. Err.: .075435  
z: 7.25  
P>|z|: 0.000  
95% Conf. Interval: .3990964-.6947962  

Antworten:


44

Im Allgemeinen können Sie die Koeffizienten aus der Ausgabe einer Probit-Regression nicht interpretieren (zumindest nicht auf standardmäßige Weise). Sie müssen die Randeffekte der Regressoren interpretieren, dh wie stark sich die (bedingte) Wahrscheinlichkeit der Ergebnisvariablen ändert, wenn Sie den Wert eines Regressors ändern und alle anderen Regressoren bei bestimmten Werten konstant halten. Dies unterscheidet sich vom linearen Regressionsfall, in dem Sie die geschätzten Koeffizienten direkt interpretieren. Dies liegt daran, dass im Fall der linearen Regression die Regressionskoeffizienten die Randeffekte sind .

Bei der Probit-Regression ist ein zusätzlicher Berechnungsschritt erforderlich, um die Randeffekte zu erhalten, nachdem Sie die Probit-Regression angepasst haben.

Lineare und Probit-Regressionsmodelle

  • Probit Regression : Daran erinnert , dass in der Probitmodell, Sie modellieren die (bedingte) Wahrscheinlichkeit eines "erfolgreichen" Ergebnis, das heißt, , P [ Y i = 1 | X 1 i , ... , X K i ; β 0 , , β K ] = Φ ( β 0 + K k = 1 β k X k i ) wobei ΦY.ich=1

    P[Y.ich=1X1ich,,XKich;β0,,βK]=Φ(β0+k=1KβkXkich)
    ist die kumulative Verteilungsfunktion der Standardnormalverteilung. Dies besagt im Grunde genommen, dass abhängig von den Regressoren die Wahrscheinlichkeit, dass die Ergebnisvariable Y i 1 ist, eine bestimmte Funktion einer linearen Kombination der Regressoren ist.Φ()Y.ich
  • Lineare Regression : Vergleichen Sie dies mit dem linearen Regressionsmodell

der (bedingte) Mittelwert des Ergebnisses ist eine lineare Kombination von die Regressoren.

E(Y.ichX1ich,,XKich;β0,,βK)=β0+k=1KβkXkich

Randeffekte

Anders als im linearen Regressionsmodell haben Koeffizienten selten eine direkte Interpretation. Wir sind in der Regel an den Ceteris-Paribus- Effekten von Änderungen der Regressoren interessiert, die sich auf die Merkmale der Ergebnisvariablen auswirken. Dies ist die Vorstellung, dass marginale Effekte messen.

  • Lineare Regression : Ich möchte nun wissen, um wie viel sich der Mittelwert der Ergebnisvariablen bewegt, wenn ich einen der Regressoren bewege

E(Y.ichX1ich,,XKich;β0,,βK)Xkich=βk

k

  • Probit-Regression : Es ist jedoch leicht zu erkennen, dass dies bei der Probit-Regression nicht der Fall ist

P[Y.ich=1X1ich,,XKich;β0,,βK]Xkich=βkϕ(β0+k=1KβkXkich)
ϕ()

Wie können Sie diese Größe berechnen, und welche Möglichkeiten haben die anderen Regressoren, die diese Formel eingeben sollen? Zum Glück liefert Stata diese Berechnung nach einer Probit-Regression und liefert einige Standardwerte der Auswahl der anderen Regressoren (es gibt keine universelle Übereinstimmung über diese Standardwerte).

Diskrete Regressoren

Xkich{0,1} ist ,

ΔXkichP[Y.ich=1X1ich,,XKich;β0,,βK]=βkϕ(β0+l=1k-1βlXlich+βk+l=k+1KβlXlich)-βkϕ(β0+l=1k-1βlXlich+l=k+1KβlXlich)

Berechnung von Randeffekten in Stata

Probit-Regression : Hier ist ein Beispiel für die Berechnung von Randeffekten nach einer Probit-Regression in Stata.

webuse union   
probit union age grade not_smsa south##c.year
margins, dydx(*)

Hier ist die Ausgabe, die Sie vom marginsBefehl erhalten

. margins, dydx(*)

Average marginal effects                          Number of obs   =      26200
Model VCE    : OIM

Expression   : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |    .003442    .000844     4.08   0.000     .0017878    .0050963
       grade |   .0077673   .0010639     7.30   0.000     .0056822    .0098525
    not_smsa |  -.0375788   .0058753    -6.40   0.000    -.0490941   -.0260634
     1.south |  -.1054928   .0050851   -20.75   0.000    -.1154594   -.0955261
        year |  -.0017906   .0009195    -1.95   0.051    -.0035928    .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

Dies kann zum Beispiel so interpretiert werden, dass die Änderung der ageVariablen um eine Einheit die Wahrscheinlichkeit des Gewerkschaftsstatus um 0,003442 erhöht. In ähnlicher Weise verringert sich die Wahrscheinlichkeit eines Gewerkschaftsstatus um 0,1054928 , wenn man aus dem Süden kommt

Lineare Regression : Als letzte Überprüfung können wir bestätigen, dass die Randeffekte im linearen Regressionsmodell dieselben sind wie die Regressionskoeffizienten (mit einer kleinen Drehung). Ausführen der folgenden Regression und Berechnen der Randeffekte nach

sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)

gibt nur die Regressionskoeffizienten zurück. Beachten Sie die interessante Tatsache, dass Stata den Netto- Marginaleffekt eines Regressors berechnet, einschließlich des Effekts durch die quadratischen Terme, falls im Modell enthalten.

. margins, dydx(*)

Average marginal effects                          Number of obs   =         74
Model VCE    : OLS

Expression   : Linear prediction, predict()
dy/dx w.r.t. : weight foreign

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0069641   .0006314   -11.03   0.000    -.0082016   -.0057266
     foreign |    -2.2035   1.059246    -2.08   0.038    -4.279585   -.1274157
------------------------------------------------------------------------------

Ich denke, dein Ausdruck für ΔXkdenn der diskrete Regressorfall ist falsch. Sie nehmen die Differenz der Ableitung vonP[Y.=1], aber es sollte der Unterschied sein P[Y.=1]. Es sollte nur der zweite Term der RHS sein, aber ohne das negative Vorzeichen.
Ravi

1

Auch und einfacher kann der Koeffizient in einer Probit-Regression interpretiert werden als "eine um eine Einheit erhöhte Altersrate entspricht einer βeinGeErhöhung des Z-Scores für die Wahrscheinlichkeit, in einer Gewerkschaft zu sein "( siehe Link ).

. webuse union

. keep union age grade

. probit union age grade

Iteration 0:   log likelihood =  -13864.23  
Iteration 1:   log likelihood = -13796.359  
Iteration 2:   log likelihood = -13796.336  
Iteration 3:   log likelihood = -13796.336  

Probit regression                               Number of obs     =     26,200
                                                LR chi2(2)        =     135.79
                                                Prob > chi2       =     0.0000
Log likelihood = -13796.336                     Pseudo R2         =     0.0049

------------------------------------------------------------------------------
       union |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |   .0051821   .0013471     3.85   0.000     .0025418    .0078224
       grade |   .0373899   .0035814    10.44   0.000     .0303706    .0444092
       _cons |  -1.404697   .0587797   -23.90   0.000    -1.519903   -1.289491
------------------------------------------------------------------------------

Dann mach

predict yhat

Und Sie werden sehen, dass für obs 1 der angepasste Wert dem entspricht βeinGe20+βGreinde12+βcÖns. normal()Stecken Sie das in die Funktion, um die entsprechende Wahrscheinlichkeit zurückzugeben:

di normal(.0051821*20 + .0373899*12 + -1.404697)
.19700266

Eine Erhöhung des Alters um eine Einheit entspricht daher aβeinGe Erhöhung des Z-Scores der Wahrscheinlichkeit, in der Gewerkschaft zu sein.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.