Interpretation von Betareg Coef


8

Ich habe Daten, bei denen das Ergebnis der Anteil einer Art ist, der in einem Gebiet von einer Maschine an zwei verschiedenen Tagen beobachtet wurde. Da das Ergebnis ein Anteil ist und nicht 0 oder 1 enthält, habe ich eine Beta-Regression verwendet, um das Modell anzupassen. Die Temperatur wird als unabhängige Variable verwendet. Hier ist ein Spielzeug-R-Code:

set.seed(1234)
library(betareg)
d <- data.frame(
  DAY = c(1,1,1,1,2,2,2,2),
  Proportion = c(.4,.1,.25, .25, .5,.3,.1,.1),
  MACHINE = c("A","B","C","D","H","G","K","L"),
  TEMPERATURE = c(rnorm(8)*100)
)
b <- betareg(Proportion ~ TEMPERATURE,
  data= d, link = "logit", link.phi = NULL, type = "ML")
summary(b)
## Call:
## betareg(formula = Proportion ~ TEMPERATURE, data = d, link = "logit", link.phi = NULL, type = "ML")
## 
## Standardized weighted residuals 2:
##     Min      1Q  Median      3Q     Max 
## -1.2803 -1.2012  0.3034  0.6819  1.6494 
## 
## Coefficients (mean model with logit link):
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -1.0881982  0.2620518  -4.153 3.29e-05 ***
## TEMPERATURE  0.0003469  0.0023677   0.147    0.884    
## 
## Phi coefficients (precision model with identity link):
##       Estimate Std. Error z value Pr(>|z|)  
## (phi)    9.305      4.505   2.066   0.0389 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Oben sehen Sie, dass der TEMPERATUREKoeffizient .0003469 ist. Exponentiating, exp (.0003469) = 1.000347

Update mit Antworten und Kommentaren:

Sie können hier sehen, wie eine Erhöhung der Temperatur um 1 Einheit von -10 auf 10 den Anteil erhöht

nd <- data.frame(TEMPERATURE = seq(-10, 10, by = 1))
nd$Proportion <- predict(b, newdata = nd)
nd$proportion_ratio <- nd$Proportion/(1 - nd$Proportion)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")

Die Interpretation lautet: Eine Änderung um 1 Einheit TEMPERATUREführt zu einer relativen Änderung von 1.000347 ≈0,04% in Proportion:

E.(P.rÖpÖrtichÖn)1- -E.(P.rÖpÖrtichÖn)

Das Schlüsselwort dort ist eine relative Änderung. Wenn Sie also mit vergleichen exp(coef(b))[2], werden nd$proportion_ratio[2] / nd$proportion_ratio[1] Sie feststellen, dass sie gleich sind

## ratio of proportion
nd$proportion_ratio[2] / nd$proportion_ratio[1] 
exp(coef(b))[2]
nd$proportion_ratio[-1] / nd$proportion_ratio[-20]

Wenn das so Proportionist, wie der Name es vermuten lässt, dann ist es diskret, nicht kontinuierlich und eine logistische Regression wäre wahrscheinlich besser geeignet, um es zu modellieren.
Tim

Tim, warum? Der Anteil kann ein Verhältnis von zwei Konzentrationen sein. Vom Benutzer gemeldeter Wert auf der Skala 1-100 (Bruchteil der 100%). In beiden Fällen ist der Anteil kontinuierlich. Im ersten Fall ist es positiv (kann> 1 sein, abhängig davon, was durch was geteilt wird), im zweiten Fall ist es bei 0 und 1 abgeschnitten.
Natalie

Antworten:


10

Ja, der Logit-Link kann so interpretiert werden. Es ist einfach keine Änderung der "Gewinnchancen" (= Verhältnis der Wahrscheinlichkeiten), sondern eine Änderung des Verhältnisses der Proportionen. Formal ist die Modellgleichung für die Erwartung dieselbe wie bei der logistischen Regression: wobei . Für Ihr Setup bedeutet dies: Somit führt eine absolute Änderung von 1 Einheit zu einer relativen Änderung von

lÖGicht(μich)=xichβ
μich=E.(yich)
lÖGicht(E.(P.rÖpÖrtichÖn))=- -1.31+0,004T.empereintureE.(P.rÖpÖrtichÖn)1- -E.(P.rÖpÖrtichÖn)=exp(- -1.31+0,004T.empereinture)
T.empereintureexp(0,004)0,4%.in .E.(P.rÖpÖrtichÖn)/.(1- -E.(P.rÖpÖrtichÖn))

Mit ein wenig Übung können Sie ein vernünftiges Gefühl dafür bekommen, was dies im tatsächlich erwarteten . Wenn Sie dieses Gefühl (noch) nicht haben, können Sie die Auswirkungen der Änderungen in leicht berechnen , z.P.rÖpÖrtichÖnT.empereinture

nd <- data.frame(TEMPERATURE = seq(-150, 150, by = 50))
nd$Proportion <- predict(b, newdata = nd)
print(nd)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")

um zu überprüfen, was die absoluten Änderungen in Proportionfür bestimmte absolute Änderungen in sind TEMPERATURE.


Danke für Ihre Antwort. Um klar zu sein, würde die 1,004 in meinem Beispiel bedeuten, dass ein Temperaturanstieg um 1 Einheit dazu führt, dass der Anteil der Arten, die von JEDER Maschine beobachtet werden, um 0,4 Prozent steigt. Wenn Sie sagen "Es handelt sich nicht um eine Änderung der Gewinnchancen, sondern um eine Änderung des Verhältnisses der Proportionen", können Sie die Mathematik, die dies beschreibt, auf irgendeine Weise veröffentlichen oder den Aufruf für die Vorhersage (b, newdata) manuell codieren, damit die Mathematik wie die Modell Coefs werden in Proportionen umgewandelt? Ich sehe, dass die Vorhersage die Koefs und neuen Temperaturdaten aufnimmt und eine zunehmende Beziehung zeigt, aber die Mathematik ist immer noch verschwommen. Danke nochmal!
user3022875

Es ist fast das gleiche wie im Fall der logistischen Regression - siehe meine aktualisierte Antwort. Die Berechnungen sind also im Wesentlichen gleich, aber das Ergebnis ist keine Wahrscheinlichkeit, sondern ein Anteil. Beachten Sie jedoch, dass Sie für die modellierte Beta-Distribution mehr Aspekte modellieren können als nur die Erwartung. Die predictMethode kann Ihnen den erwarteten oder nur den linearen Prädiktor ( ), den Parameter , die Varianz, Quantile usw. geben"response" μich"link""precision"ϕich
Achim Zeileis

Kannst du klarer sein? mit exp (.004) - eine Erhöhung der Temperatur um 1 Einheit erhöht das Quotenverhältnis von was? um 0,04%? Ein Laienpublikum wird die Zunahme von "E / 1-E" nicht verstehen
user3022875

Wenn Sie sagen: "Die Berechnungen sind also im Wesentlichen gleich, aber das Ergebnis ist keine Wahrscheinlichkeit, sondern ein Anteil." Bezieht sich der Anteil, auf den Sie sich beziehen, auf den ursprünglichen Anteil oder auf einen Anteil? In der logistischen Regression ist das Quotenverhältnis das Verhältnis der Chancen, in einer Kategorie zu sein, zu der Nicht-Kategorie. Was bedeutet das Quotenverhältnis, wenn es keine Kategorie gibt und die ID eine fortlaufende Zahl (0,1) ist? Können Sie eine Interpretation der 0,04% liefern, die keine Formeln enthält, die Laien verstehen würden?
user3022875

Der Anteil ist der ursprüngliche Anteil, zB bedeutet in den GasolineYieldDaten yield = 0.5, dass der Anteil von 50% Rohöl in Benzin umgewandelt wird. Dies entspricht einem Verhältnis von 1 = 0,5 / 0,5, dh es wird so viel Rohöl umgewandelt wie nicht umgewandelt. Wenn dies um 10% zunimmt, beträgt das neue Verhältnis 1,1, was einem Anteil von etwa 0,5238 entspricht. Somit sind die Rechenschritte im Wesentlichen die gleichen wie im Logit-Modell. Re: Erklärung für Laien. Ich habe die Erfahrung gemacht, dass auch Quotenverhältnisse sehr schwer zu verstehen sind ... daher verwende ich häufig Effektdiagramme.
Achim Zeileis
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.