OLS vs. Poisson GLM mit Identitätslink

Meine Frage zeigt mein schlechtes Verständnis der Poisson-Regression und der GLMs im Allgemeinen. Hier sind einige gefälschte Daten, um meine Frage zu veranschaulichen:

### some fake data
x=c(1:14)
y=c(0,  1,  2,  3,  1,  4,  9, 18, 23, 31, 20, 25, 37, 45)

Einige benutzerdefinierte Funktionen zur Rückgabe von pseudo-R2:

### functions of pseudo-R2

psuR2 <- function(null.dev, model.dev) { 1 - (model.dev / null.dev)}

predR2 <- function(actuals, predicted) { 1 - (sum((actuals - predicted)^2)) / sum((actuals - mean(actuals))^2)}

Passen Sie vier Modelle an: OLS, Gaußsches GLM mit Identitätsverknüpfung, Poisson GLM mit Protokollverknüpfung, Poisson GLM mit Identitätsverknüpfung

#### OLS MODEL
mdl.ols=lm(y~x)
summary(mdl.ols)
pred.ols = predict(mdl.ols)

summary(mdl.ols)$r.squared
predR2(y, pred.ols)

#### GLM MODEL, family=gaussian(link="identity")
mdl.guass <- glm(y~x, family=gaussian(link="identity"), maxit=500)
summary(mdl.guass)
pred.guass = predict(mdl.guass)

psuR2(mdl.guass$null.deviance, mdl.guass$deviance)
predR2(y, pred.guass)

#### GLM MODEL, family=possion (canonical link)
mdl.poi_log <- glm(y~x, family=poisson(link="log"), maxit=500)
summary(mdl.poi_log)
pred.poi_log= exp(predict(mdl.poi_log))  #transform

psuR2(mdl.poi_log$null.deviance, mdl.poi_log$deviance)
predR2(y, pred.poi_log)

#### GLM MODEL, family=poisson((link="identity")
mdl.poi_id <- glm(y~x, family=poisson(link="identity"), start=c(0.5,0.5), maxit=500)
summary(mdl.poi_id)
pred.poi_id = predict(mdl.poi_id)

psuR2(mdl.poi_id$null.deviance, mdl.poi_id$deviance)
predR2(y, pred.poi_id)

Zeichnen Sie schließlich die Vorhersagen:

#### Plot the Fit
plot(x, y) 
lines(x, pred.ols)
lines(x, pred.guass, col="green")
lines(x,pred.poi_log, col="red")
lines(x,pred.poi_id, col="blue")

Ich habe 2 Fragen:

Es scheint, dass die Koeffizienten und Vorhersagen von OLS und Gaußschem GLM mit Identitätsverknüpfung genau gleich sind. Ist das immer wahr?
Ich bin sehr überrascht, dass sich die OLS-Schätzungen und -Vorhersagen stark vom Poisson GLM mit Identitätsverknüpfung unterscheiden . Ich dachte, beide Methoden würden versuchen, E (Y | X) zu schätzen. Wie sieht die Wahrscheinlichkeitsfunktion aus, wenn ich den Identitätslink für Poisson verwende?

generalized-linear-model poisson-distribution

— William Chiu
quelle

Siehe auch

— kjetil b halvorsen

Wenn Sie kleinste Quadrate erstellen möchten, um das Poisson-Modell mit Identitätsverknüpfung zu approximieren, können Sie auch ein gewichtetes Modell der kleinsten Quadrate (mdl.wols = lm (y ~ x, Gewichte = 1 / log (y + 1.00000000001)) an das Protokoll anpassen (y + 1.00000000001) wird dann als erste Schätzung der Varianz genommen (sqrt (y + 1E-10)) funktioniert ebenfalls - die Schätzungen solcher Modelle würden denen des Poisson GLM mit Identitätsverknüpfung sehr nahe kommen ...

— Tom Wenseleers

Ja, sie sind dasselbe. MLE für einen Gaußschen Wert ist das kleinste Quadrat. Wenn Sie also einen Gaußschen GLM mit Identitätsverknüpfung ausführen, führen Sie OLS aus.
a) " Ich dachte, beide Methoden würden versuchen, E (Y | X) zu schätzen. "

In der Tat, aber die Art und Weise, wie die bedingte Erwartung als Funktion der Daten geschätzt wird, ist nicht dieselbe. Selbst wenn wir die Verteilung (und damit die Art und Weise, wie die Daten in die Wahrscheinlichkeit eingehen) ignorieren und nur in Bezug auf Mittelwert und Varianz über das GLM nachdenken (als wäre es nur eine gewichtete Regression), steigt die Varianz eines Poisson mit dem Mittelwert Die relativen Gewichte der Beobachtungen wären unterschiedlich.

b) " Wie sieht die Wahrscheinlichkeitsfunktion aus, wenn ich den Identitätslink für Poisson verwende? "

$\mathcal{L}(\beta_0,\beta_1) = \prod_i e^{-\lambda_i}\lambda_i^{y_i}/y_i!$

$\qquad\qquad\,=\exp(\sum_i -\lambda_i+{y_i}\log(\lambda_i)-\log{(y_i!)}\,)\quad$ wobei $\lambda_i=\beta_0+\beta_1 x_i$

$\qquad\qquad\,=\exp(\sum_i -(\beta_0+\beta_1 x_i)+{y_i}\log(\beta_0+\beta_1 x_i)-\log{(y_i!)}\,)$

— Glen_b - Monica neu starten
quelle

Eine Ausarbeitung zu Glen_bs zweitem Punkt. Eine Geschichte, die ich mir selbst erzählt habe und die ich als ziemlich klar empfunden habe, ist, dass das Modell mit zunehmendem geschätzten bedingten Mittelwert im Poisson-Modell toleranter gegenüber Datenwerten wird, die weit vom bedingten Mittelwert entfernt sind. Vergleichen Sie dies mit dem geraden linearen Modell, das unabhängig vom geschätzten bedingten Mittelwert einheitlich tolerant ist.

— Matthew Drury

@Glen_b, kann ich Sie bitten zu klären, was Sie gesagt haben: "daher, wie die Daten die Wahrscheinlichkeit eingeben". Wollen Sie damit sagen, dass die Wahrscheinlichkeit der Modellanpassung zwischen einem OLS und einem POisson (Link = Identität) unterschiedlich ist, wenn sie mit MLE angepasst werden? Dh, wenn Sie OLS mit MLE anpassen, verwenden Sie die Wahrscheinlichkeitsfunktion für die Normalverteilung, um die Wahrscheinlichkeit der Anpassung gegenüber der Wahrscheinlichkeitsfunktion aus der Poissonverteilung im letzteren Fall zu berechnen?

— Alex

@ Alex Right; OLS ist ML bei der Gaußschen und Gaußsche Wahrscheinlichkeit ist nicht Poisson Wahrscheinlichkeit

— Glen_b -Reinstate Monica