Ich glaube nicht, dass der Titel Ihrer Frage genau das wiedergibt, wonach Sie fragen.
Die Frage, wie die Parameter in einem GLM zu interpretieren sind, ist sehr weit gefasst, da das GLM eine sehr breite Klasse von Modellen darstellt. Denken Sie daran, dass ein GLM eine Antwortvariable modelliert , von der angenommen wird, dass sie einer bekannten Verteilung aus der Exponentialfamilie folgt, und dass wir eine invertierbare Funktion g so gewählt haben, dass
E [ yyG
für J Prädiktorvariablen x . In diesem Modell ist die Interpretation eines bestimmten Parameters β j ist die Änderungsrate von g ( y ) in Bezug auf x j . Definiere μ ≡ E [ y
E [ y|x ] = g- 1( x0+ x1β1+⋯+xJβJ)
JxβjG( y)xj und
η≤x≤β, um die Notation sauber zu halten. Dann wird für jeden
j∈{1,...,J},
β j = ∂μ ≡ E [ y|x ] = g- 1( x )η≡ x ⋅ βj∈{1,…,J}
Definieren Sie nun
ejals einen Vektor von
J-1Nullen und einer einzelnen
1in der
j -ten Position, so dass zum Beispiel, wenn
J=5,dann
e3=(0,0,1,0,0). Dann ist
βj=g(E [ yβj=∂η∂xj=∂g(μ)∂xj.
ejJ−11jJ=5e3=(0,0,1,0,0)βj=g(E[y|x+ej])−g(E[y|x])
Was nur bedeutet, dass die Auswirkung einer Einheitszunahme von x j auf η ist .βjηxj
Sie können die Beziehung auch folgendermaßen angeben :
und
E[y
∂E[y|x]∂xj=∂μ∂xj=dμdη∂η∂xj=∂μ∂ηβj=dg−1dηβj
E[y|x+ej]−E[y|x]≡Δjy^=g−1((x+ej)β)−g−1(xβ)
Ohne etwas über wissen , ist das so weit wie möglich. β j ist die Wirkung auf η , der den transformierten bedingten Mittelwert von y , der eine Einheitszunahme in x j , und die Wirkung auf den bedingten Mittelwert von y einer Einheit Erhöhung x jgβjηyxjyxj ist .g−1(β)
Sie scheinen jedoch speziell nach der Poisson-Regression mit der Standard-Link-Funktion von R zu fragen, die in diesem Fall der natürliche Logarithmus ist. Wenn das der Fall ist, sind Sie zu fragen , eine bestimmte Art von GLM in denen und g = ln . Dann können wir eine gewisse Zugkraft in Bezug auf eine bestimmte Interpretation bekommen.y∼Poisson(λ)g=ln
Aus dem, was ich oben gesagt habe, wissen wir, dass . Und da wir wissen, dassg(μ)=ln(μ) ist, wissen wir auch, dassg-1(η)=eη ist. Wir wissen zufällig auch, dassdeη∂μ∂xj=dg−1dηβjg(μ)=ln(μ)g−1(η)=eη, also können wir sagen, dass
∂μdeηdη=eη
∂μ∂xj=∂E[y|x]∂xj=ex0+x1β1+⋯+xJβJβj
was endlich etwas greifbares bedeutet:
xjy^y^βj
Hinweis: Diese Näherung kann tatsächlich für Änderungen bis zu 0,2 funktionieren, je nachdem, wie viel Präzision Sie benötigen.
Δjy^=ex0+x1β1+⋯+(xj+1)βj+⋯+xJβJ−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ+βj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJeβj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ(eβj−1)
which means
Given a unit change in xj, the fitted y^ changes by y^(eβj−1).
There are three important pieces to note here:
- The effect of a change in the predictors depends on the level of the response.
- An additive change in the predictors has a multiplicative effect on the response.
- You can't interpret the coefficients just by reading them (unless you can compute arbitrary exponentials in your head).
So in your example, the effect of increasing pH by 1 is to increase lny^ by y^(e0.09−1); that is, to multiply y^ by e0.09≈1.09. It looks like your outcome is the number of darters you observe in some fixed unit of time (say, a week). So if you're observing 100 darters a week at a pH of 6.7, raising the pH of the river to 7.7 means you can now expect to see 109 darters a week.