Ich bin nicht ganz sicher, ob meine Antwort richtig ist, aber ich würde argumentieren, dass es keine allgemeine Beziehung gibt. Hier ist mein Punkt:
Lassen Sie uns den Fall untersuchen, in dem das Konfidenzintervall der Varianz gut verstanden ist, nämlich Stichproben aus einer Normalverteilung (wie Sie im Tag der Frage angeben, aber nicht wirklich die Frage selbst). Siehe die Diskussion hier und hier .
Ein Konfidenzintervall für folgt aus dem Pivot , wobei . (Dies ist nur eine andere Art, den möglicherweise bekannteren Ausdruck schreiben , wobei ) T = n σ 2 / σ 2 ~ χ 2 n - 1 σ 2 = 1 / N Σ i ( X i - ˉ X ) 2 T = ( n - 1 ) s 2 / σ 2 ~ χ 2 n - 1 s 2 = 1 / ( n - 1σ2T=nσ^2/σ2∼χ2n−1σ^2=1/n∑i(Xi−X¯)2T=(n−1)s2/σ2∼χ2n−1s2=1/(n−1)∑i(Xi−X¯)2
Wir haben also
Daher ist ein Konfidenzintervall . Wir können und als Quantile und .(nσ2/cn-1u,nσ2/cn-1l)cn-1lcn-1ucn-1u=χ2n-1,1-α/2cn-1l
1−α=Pr{cn−1l<T<cn−1u}=Pr{cn−1lnσ^2<1σ2<cn−1unσ^2}=Pr{nσ^2cn−1u<σ2<nσ^2cn−1l}
(nσ^2/cn−1u,nσ^2/cn−1l)cn−1lcn−1ucn−1u=χ2n−1,1−α/2cn−1l=χ2n−1,α/2
(Beachten Sie nebenbei, dass für jede Varianzschätzung, dass die Quantile , wenn die -Verteilung verzerrt ist, ein ci mit der richtigen Überdeckungswahrscheinlichkeit ergeben, aber nicht optimal sind, dh nicht die kürzestmöglichen. Für ein Vertrauen Um das Intervall so kurz wie möglich zu halten, muss die Dichte am unteren und oberen Ende des ci identisch sein, da einige zusätzliche Bedingungen wie Unimodalität vorliegen. Ich weiß nicht, ob die Verwendung dieses optimalen ci die Dinge in dieser Antwort ändern würde.)χ2
Wie in den Links erläutert, verwendet , wobei das Bekannte verwendet bedeuten. Daher erhalten wir ein weiteres gültiges Konfidenzintervall
Hier und sind somit Quantile aus der . s 2 0 = 1T′=ns20/σ2∼χ2n 1 - αs20=1n∑i(Xi−μ)2cnlcnuχ2n
1−α=Pr{cnl<T′<cnu}=Pr{ns20cnu<σ2<ns20cnl}
cnlcnuχ2n
Die Breiten der Konfidenzintervalle sind
und
Die relative Breite ist
Wir wissen, dass als Stichprobenmittelwert minimiert die Summe der quadratischen Abweichungen. Darüber hinaus sehe ich nur wenige allgemeine Ergebnisse bezüglich der Breite des Intervalls, da mir keine eindeutigen Ergebnisse bekannt sind, wie sich Unterschiede und Produkte von oberen und unteren Quantilen verhalten, wenn wir die Freiheitsgrade um eins erhöhen (aber sehen Sie die Abbildung unten). wT'=ns 2 0 (C n u -c n l )
wT=nσ^2(cn−1u−cn−1l)cn−1lcn−1u
wT.wT′=ns20(cnu−cnl)cnlcnu
wTwT′=σ^2s20cn−1u−cn−1lcnu−cnlcnlcnucn−1lcn−1u
σ^2/s20≤1χ2
Zum Beispiel vermieten
rn:=cn−1u−cn−1lcnu−cnlcnlcnucn−1lcn−1u,
wir
r10≈1.226
für und , was bedeutet, dass das auf basierende ci kürzer ist, wenn
α=0.05n=10σ^2σ^2≤s201.226
Mit dem folgenden Code habe ich eine kleine Simulationsstudie durchgeführt, die darauf dass das auf basierende Intervall die meiste Zeit gewinnt. (Eine Rationalisierung dieses Ergebnisses in großen Stichproben finden Sie unter dem in Aksakals Antwort veröffentlichten Link.)s20
Die Wahrscheinlichkeit scheint sich in zu stabilisieren , aber mir ist keine analytische Erklärung für endliche Stichproben bekannt:n
rm(list=ls())
IntervalLengthsSigma2 <- function(n,alpha=0.05,reps=100000,mu=1) {
cl_a <- qchisq(alpha/2,df = n-1)
cu_a <- qchisq(1-alpha/2,df = n-1)
cl_b <- qchisq(alpha/2,df = n)
cu_b <- qchisq(1-alpha/2,df = n)
winners02 <- rep(NA,reps)
for (i in 1:reps) {
x <- rnorm(n,mean=mu)
xbar <- mean(x)
s2 <- 1/n*sum((x-xbar)^2)
s02 <- 1/n*sum((x-mu)^2)
ci_a <- c(n*s2/cu_a,n*s2/cl_a)
ci_b <- c(n*s02/cu_b,n*s02/cl_b)
winners02[i] <- ifelse(ci_a[2]-ci_a[1]>ci_b[2]-ci_b[1],1,0)
}
mean(winners02)
}
nvalues <- matrix(seq(5,200,by=10))
plot(nvalues,apply(nvalues,1,IntervalLengthsSigma2),pch=19,col="lightblue",type="b")
Die nächste Abbildung zeigt gegen und zeigt (wie die Intuition vermuten lässt), dass das Verhältnis zu 1 tendiert. Da außerdem für groß ist, wird der Unterschied zwischen den Breiten der beiden cis daher verschwinden als . (Siehe noch einmal den Link in Aksakals Antwort für eine Rationalisierung dieses Ergebnisses in großen Stichproben.)rnnX¯→pμnn→∞