Yates 'Kontinuitätskorrektur im Konfidenzintervall, zurückgegeben von prop.test

8

Dies ist das von prop.test geschätzte Konfidenzintervall

n <- 600; x <- 276; p <- 0.40
prop.test(x, n, p, alternative="two.sided", conf.level=0.95, correct=T)
95 percent confidence interval:
 0.4196787 0.5008409

Ich habe versucht, es zu reproduzieren, indem ich den Code unter prop.test gelesen habe. Hier ist ein vereinfachter Weg, um diese beiden Grenzen zu erreichen

ESTIMATE <- x/n
YATES <- 0.5
conf.level <- 0.95
z <- qnorm((1 + conf.level)/2)
YATES <- min(YATES, abs(x - n * p)) 
z22n <- z^2/(2 * n)
p.c <- ESTIMATE + YATES/n
(p.c + z22n + z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.5008409
p.c <- ESTIMATE - YATES/n
(p.c + z22n - z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.4196787

Können Sie mir erklären, warum die zugrunde liegende Erfolgswahrscheinlichkeit (p) in Zeile 5 verwendet wird? oder vielleicht könnten Sie vorschlagen, wo ich weitere Informationen zu dieser YATES-Korrektur finden kann, die sich auf die SCHÄTZUNG auswirkt.

Vielen Dank

r confidence-interval yates-correction

— George Dontas
quelle

3

Auf der Hilfeseite wird angegeben, dass "die Kontinuitätskorrektur nur verwendet wird, wenn die Differenz zwischen Stichproben- und Nullanteilen im absoluten Wert nicht überschritten wird." Dies ist, was Zeile 5 überprüft: x/nist der empirische Anteil, pist der Nullanteil. (Eigentlich finde ich das "wenn" etwas irreführend, da es eher ein "insofern es nicht überschreitet", wenn ich Zeile 5 betrachte.)

— Karakal
quelle

7

Bei der zweiten Frage, wo Sie weitere Informationen zu dieser Kontinuitätskorrektur finden können (Yates in der Hilfe für, prop.testaber nicht in den nachstehenden Referenzen zugeschrieben , denke ich, dass Yates ursprünglich eine Kontinuitätskorrektur nur für den Chi-Quadrat-Test für Kontingenztabellen vorgeschlagen hat ). ::

Newcombe RG. Zweiseitige Konfidenzintervalle für den einzelnen Anteil: Vergleich von sieben Methoden. Stat Med 1998; 17 (8): 857 & ndash; 872. PMID: 9595616
Brown LD, Cai TT, DasGupta A. Intervallschätzung für einen Binomialanteil (mit Kommentaren und Gegenerwiderung). Statistical Science 2001; 16 (2): 101 & ndash; 133. doi: 10.1214 / ss / 1009213286

Das kontinuitätskorrigierte Wilson-Score-Intervall ist 'Methode 4' in Newcomb. Brown et al. Betrachten Sie nur das unkorrigierte Wilson-Bewertungsintervall im Haupttext, aber George Casella schlägt vor, die kontinuitätskorrigierte Version in seinem Kommentar (S. 121) zu verwenden, den Brown et al. diskutieren in ihrer Gegenerwiderung (S. 130):

Casella schlägt die Möglichkeit vor, eine Kontinuitätskorrektur der Score-Statistik durchzuführen, bevor ein Konfidenzintervall erstellt wird. Wir stimmen diesem Vorschlag aus keiner Perspektive zu. Diese "kontinuitätskorrigierten Wilson" -Intervalle weisen äußerst konservative Abdeckungseigenschaften auf, obwohl im Prinzip nicht garantiert werden kann, dass sie überall konservativ sind. Aber selbst wenn das Ziel im Gegensatz zu unserem darin besteht, konservative Intervalle zu erzeugen, sind diese Intervalle auf ihrem normalen Niveau im Vergleich zu Blyth-Still oder sogar Clopper-Pearson sehr ineffizient.

Das "genaue" Intervall von Clopper-Pearson wird binom.testin R angegeben. Ich würde empfehlen, dieses prop.testIntervall zu verwenden, anstatt ein konservatives Intervall zu wünschen, dh eines, das eine Abdeckung von mindestens 95% garantiert . Wenn Sie ein Intervall bevorzugen, das im Durchschnitt eine Abdeckung von fast 95% (über p) aufweist und daher häufig enger ist, können Sie prop.test(…, correct=FALSE)das unkorrigierte Wilson-Bewertungsintervall angeben.

Das Standardlehrbuch für solche Angelegenheiten ist Fleiss Statistical Methods for Rates and Proportions . Newcomb verweist auf die ursprüngliche Ausgabe von 1981, aber die neueste Ausgabe ist die 3. (2003) . Ich habe es jedoch nicht selbst überprüft.

— ein Stop
quelle

2

Eine weitere Referenz für den Vergleich von binomialen CIs ist Brown LD, Cai TT & DasGupta, A. (2001). Intervallschätzung für einen Binomialanteil. Statistical Science, 16 (2), 101 & ndash; 133. projecteuclid.org/euclid.ss/1009213286 (offener Zugang). Das binomPaket von R enthält auch den Agresti-Coull CI.

— Caracal