Kann jemand erklären, wie man den Randeffekt des Probit- und Logit-Modells in Laienbegriffen berechnet?
Ich bin neu in der Statistik und bin verwirrt über diese beiden Modelle.
Kann jemand erklären, wie man den Randeffekt des Probit- und Logit-Modells in Laienbegriffen berechnet?
Ich bin neu in der Statistik und bin verwirrt über diese beiden Modelle.
Antworten:
Ich denke , eine bessere Möglichkeit , den marginalen Effekt einer bestimmten Variablen, sagen zu sehen , ist ein Streudiagramm der vorhergesagten Wahrscheinlichkeit auf der vertikalen Achse zu erzeugen, und haben X j auf der horizontalen Achse. Dies ist die "Laien" -Methode, die ich mir vorstellen kann, um anzuzeigen, wie einflussreich eine bestimmte Variable ist. Keine Mathematik, nur Bilder. Wenn Sie viele Datenpunkte haben, kann ein Boxplot oder ein Streudiagramm glatter helfen, um zu sehen, wo sich die meisten Daten befinden (im Gegensatz zu nur einer Punktwolke).
Ich bin mir nicht sicher, wie "Laie" der nächste Abschnitt ist, aber Sie finden ihn möglicherweise nützlich.
Wenn wir den Randeffekt betrachten, nennen wir ihn und stellen fest, dass g ( p ) = ∑ k X k β k ist ist
Der marginale Effekt hängt also zusätzlich zum Beta von der geschätzten Wahrscheinlichkeit und dem Gradienten der Link-Funktion ab. Die Division durch ergibt sich aus der Kettenregel zur Differenzierung und der Tatsache, dass ∂ g - 1 ( z ) . Dies kann gezeigt werden, indem beide Seiten der offensichtlich wahren Gleichungz=g[g-1(z)] unterschieden werden. Wir haben auch, dassg-1(XTβ)=pper Definition ist. Für ein Logit-Modell giltg(p)=log(p)-log(1 , und der marginale Effekt ist:
Was bedeutet das? Die Vertiefung ist bei p = 0 und bei p = 1 Null und erreicht bei p = 0,5 ihren Maximalwert von 0,25 . Der marginale Effekt ist also am größten, wenn die Wahrscheinlichkeit nahe 0,5 liegt , und am kleinsten, wenn p nahe 0 oder nahe 1 ist . Allerdings p ( 1 - p ) hängt noch von X j , so dass die marginalen Effekten kompliziert sind. In der Tat, weil es darauf ankommt , werden Sie einen anderen marginalen Effekt für verschiedene bekommen Werte. Möglicherweise ein guter Grund, nur dieses einfache Streudiagramm zu erstellen - Sie müssen nicht auswählen, welche Werte der Kovariaten verwendet werden sollen.
Für ein Probit-Modell gilt wobeiΦ(.)Standard normales CDF undϕ(.)Standard normales PDF ist. So bekommen wir:
Beachten Sie, dass dies hat die meisten Eigenschaften , dass der marginaler Effekt I früher diskutiert, und gilt auch für jede Link - Funktion , die etwa symmetrisch ist 0,5 (und gesund, natürlich, zum Beispiel g ( p ) = t a n ( π). The dependence on is more complicated, but still has the general "hump" shape (highest point at , lowest at and ). The link function will change the size of the maximum height (e.g. probit maximum is , logit is ), and how quickly the marginal effect is tapered towards zero.
effects
package in R can easily produce such plots of predicted probability on the vertical axis vs X on the horizontal axis. See socserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html
The logit and probit models are typically used to figure out a probability that the dependent variable y is 0 or 1 based on a number of input variables.
In English: Suppose you're trying to predict a binary value, such as whether or not somebody will develop heart disease during their life. You have a number of input variables such as blood pressure, age, whether or not they are a smoker, their BMI, where they live, etc. etc. All those variables may contribute in some way to the chances of somebody developing heart disease.
The marginal effect of a single input variable is if you raise that variable by a bit, how does that affect the probability of having heart disease? Suppose blood pressure increases by a slight amount, how does that change the chances of having heart disease? Or if you raise the age by a year?
Some of these effects could also be non-linear: increasing BMI by a slight amount may have a very different effect for somebody who has a very healthy BMI than for somebody who does not.
You'd still want your layman to know the calculus, as marginal effect is the derivative of a fitted probability with respect to the variable of interest. As fitted probability is the link function (logit, probit or whatever) applied to the fitted values, you need the chain rule to compute it. So, in linear index models (where parameters enter as something like X'b) it is equal to the parameter estimate times the derivative of the link function. As the derivative is different at different values of the regressors (unlike the case of a linear model), you have to decide, where to evaluate the marginal effect. A natural choice would be mean values of all the regressors. Another approach would be to evaluate the effect for the each observation and then average over them. The interpretation differs accordingly.