Vertrauensbereiche für die QQ-Linie

Diese Frage bezieht sich nicht speziell auf R, aber ich habe sie gewählt, um sie Rzu veranschaulichen.

Betrachten Sie den Code zum Erzeugen von Konfidenzbändern um eine (normale) qq-Linie:

library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")

Ich suche nach einer Erklärung (oder alternativ nach einem Link zu einem Papier- / Online-Dokument, das erklärt), wie diese Vertrauensbereiche aufgebaut sind (ich habe einen Verweis auf Fox 2002 in den Hilfedateien von R gesehen, aber leider habe ich dies nicht Buch handlich).

Meine Frage wird anhand eines Beispiels präzisiert. Hier Rerfahren Sie, wie diese speziellen CIs berechnet werden (ich habe den Code, in dem sie verwendet werden, verkürzt / vereinfacht car::qqPlot).

x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)     #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")

Die Frage ist: Was ist die Rechtfertigung für die Formel zur Berechnung dieser SE (z SE<-(b/dnorm(z))*sqrt(P*(1-P)/n). B. die Linie ).

FWIW diese Formel unterscheidet sich sehr von der Formel der üblichen Konfidenzbänder in der linearen Regression

confidence-interval linear-model qq-plot

— user603
quelle

f_{X_{(k)}} (x) = \frac{n!}{(k - 1)! (n - k)!} [F_{X} (x)]^{k - 1} [1 - F_{X} (x)]^{n - k} f_{X} (x)

$f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)$

X_{(⌈ n p ⌉)} \sim A N (F^{- 1} (p), \frac{p (1 - p)}{n [f (F^{- 1} (p))]^{2}})

$X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)$

X_{(i)}

$X_{(i)}$

S E (X_{(i)}) = \frac{\hat{σ}}{p (z_{i})} \sqrt{\frac{P_{i} (1 - P_{i})}{n}}

$\mathrm{SE}(X_{(i)})=\frac{\hat{\sigma}}{p(z_i)}\sqrt{\frac{P_i(1-P_i)}{n}}$

p (z)

$p(z)$

P (z)

$P(z)$

{\hat{X}}_{(i)} = \hat{μ} + \hat{σ} z_{i}

$\widehat{X}_{(i)}=\hat{\mu}+\hat{\sigma}z_{i}$

{\hat{X}}_{(i)} \pm 2 \times S E (X_{(i)})

$\widehat{X}_{(i)}\pm 2\times \mathrm{SE}(X_{(i)})$

f (F^{- 1} (p))

$f(F^{-1}(p))$

(p (z_{i}) / \hat{σ})

$(p(z_i)/\hat{\sigma})$

— Glen_b Setzen Sie Monica

f_{X_{(k)}} (x) = \frac{n!}{(k - 1)! (n - k)!} [F_{X} (x)]^{k - 1} [1 - F_{X} (x)]^{n - k} f_{X} (x)

$f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)$

X_{(⌈ n p ⌉)} \sim A N (F^{- 1} (p), \frac{p (1 - p)}{n [f (F^{- 1} (p))]^{2}})

$X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)$

Wie COOLSerdash in Kommentaren erwähnt, schreibt John Fox [1] auf den Seiten 35-36:

$X_{(i)}$
$S E (X_{(i)}) = \frac{\hat{σ}}{p (z_{i})} \sqrt{\frac{P_{i} (1 - P_{i})}{n}}$ $\mathrm{SE}(X_{(i)})=\frac{\hat{\sigma}}{p(z_i)}\sqrt{\frac{P_i(1-P_i)}{n}}$ $p(z)$ $P(z)$ $\widehat{X}_{(i)}=\hat{\mu}+\hat{\sigma}z_{i}$ $\widehat{X}_{(i)}\pm 2\times \mathrm{SE}(X_{(i)})$

$f(F^{-1}(p))$ $(p(z_i)/\hat{\sigma})$ .

[1] Fox, J. (2008),
Applied Regression Analysis and Generalized Linear Models, 2nd Ed.,
Sage Publications, Inc

— Glen_b -Reinstate Monica
quelle