Eine Tweedie-Verteilung kann verzerrte Daten mit einer Punktmasse von Null modellieren, wenn der Parameter (Exponent in der Mittelwert-Varianz-Beziehung) zwischen 1 und 2 liegt.
In ähnlicher Weise kann ein Modell mit Null-Inflation (unabhängig davon, ob es sich um ein kontinuierliches oder ein diskretes Modell handelt) eine große Anzahl von Nullen aufweisen.
Ich habe Probleme zu verstehen, warum bei der Vorhersage oder Berechnung angepasster Werte mit diesen Arten von Modellen alle vorhergesagten Werte ungleich Null sind.
Können diese Modelle tatsächlich exakte Nullen vorhersagen?
Beispielsweise
library(tweedie)
library(statmod)
# generate data
y <- rtweedie( 100, xi=1.3, mu=1, phi=1) # xi=p
x <- y+rnorm( length(y), 0, 0.2)
# estimate p
out <- tweedie.profile( y~1, p.vec=seq(1.1, 1.9, length=9))
# fit glm
fit <- glm( y ~ x, family=tweedie(var.power=out$p.max, link.power=0))
# predict
pred <- predict.glm(fit, newdata=data.frame(x=x), type="response")
pred
Jetzt enthält keine Nullen. Ich dachte, der Nutzen von Modellen wie der Tweedie-Verteilung rührt von ihrer Fähigkeit her, exakte Nullen und den kontinuierlichen Teil vorherzusagen.
Ich weiß, dass die Variable in meinem Beispiel x
nicht sehr aussagekräftig ist.