Bei zwei Arrays x und y, die beide die Länge n haben, passe ich ein Modell y = a + b * x an und möchte ein 95% -Konfidenzintervall für die Steigung berechnen. Dies ist (b - delta, b + delta), wobei b in üblicher Weise und gefunden wird
delta = qt(0.975,df=n-2)*se.slope
und se.slope ist der Standardfehler in der Steigung. Ein Weg, um den Standardfehler der Steigung von R zu erhalten, ist summary(lm(y~x))$coef[2,2]
.
Nehmen wir nun an, ich schreibe die Wahrscheinlichkeit der Steigung bei x und y, multipliziere diese mit einem "flachen" Vorgänger und benutze eine MCMC-Technik, um eine Probe m aus der posterioren Verteilung zu ziehen. Definieren
lims = quantile(m,c(0.025,0.975))
Meine Frage: ist (lims[[2]]-lims[[1]])/2
etwa gleich Delta wie oben definiert?
Anhang Nachfolgend sehen Sie ein einfaches JAGS-Modell, bei dem diese beiden Modelle unterschiedlich zu sein scheinen.
model {
for (i in 1:N) {
y[i] ~ dnorm(mu[i], tau)
mu[i] <- a + b * x[i]
}
a ~ dnorm(0, .00001)
b ~ dnorm(0, .00001)
tau <- pow(sigma, -2)
sigma ~ dunif(0, 100)
}
Ich führe folgendes in R aus:
N <- 10
x <- 1:10
y <- c(30.5,40.6,20.5,59.1,52.5,
96.0,121.4,78.9,112.1,128.4)
lin <- lm(y~x)
#Calculate delta for a 95% confidence interval on the slope
delta.lm <- qt(0.975,df=N-2)*summary(lin)$coef[2,2]
library('rjags')
jags <- jags.model('example.bug', data = list('x' = x,'y' = y,'N' = N),
n.chains = 4,n.adapt = 100)
update(jags, 1000)
params <- jags.samples(jags,c('a', 'b', 'sigma'),7500)
lims <- quantile(params$b,c(0.025,0.975))
delta.bayes <- (lims[[2]]-lims[[1]])/2
cat("Classical confidence region: +/-",round(delta.lm, digits=4),"\n")
cat("Bayesian confidence region: +/-",round(delta.bayes,digits=4),"\n")
Und bekomme:
Klassischer Vertrauensbereich: +/- 4,6939
Bayesianische Vertrauensregion: +/- 5,1605
Die Bayesianische Vertrauensregion wird mehrmals wiederholt und ist durchweg breiter als die klassische. Liegt das an den Prioren, die ich ausgewählt habe?