Ja und nein.
Zuerst das "Ja"
Was Sie beobachtet haben, ist, dass, wenn ein Test und ein Konfidenzintervall auf derselben Statistik basieren, es eine Äquivalenz zwischen ihnen gibt: Wir können den Wert als den kleinsten Wert von interpretieren, für den der Nullwert des Parameters würde in das Konfidenzintervall einbezogen .pα1−α
Sei ein unbekannter Parameter im Parameterraum , und sei die Stichprobe ist eine Realisierung der Zufallsvariablen . Definieren Sie der Einfachheit halber ein Konfidenzintervall als ein zufälliges Intervall, so dass dessen Überdeckungswahrscheinlichkeit
(Sie könnten auch allgemeinere Intervalle in Betracht ziehen, bei denen die Wahrscheinlichkeit der Erfassung entweder durch begrenzt ist oder ungefähr gleich . Die Begründung ist analog.)θΘ⊆Rx=(x1,…,xn)∈Xn⊆RnX=(X1,…,Xn)Iα(X)
Pθ(θ∈Iα(X))=1−αfor all α∈(0,1).
1−α
Betrachten Sie einen zweiseitigen Test der Punkt-Null-Hypothese gegen die Alternative . Es sei der p-Wert des Tests. Für jede , wird auf der Ebene abgelehnt wenn . Die Stufe Zurückweisungsregion ist die Menge von die zur Zurückweisung von :
H0(θ0):θ=θ0H1(θ0):θ≠θ0λ(θ0,x)α∈(0,1)H0(θ0)αλ(θ0,x)≤αα xH0(θ0)
Rα(θ0)={x∈Rn:λ(θ0,x)≤α}.
Betrachten Sie nun eine Familie von zweiseitigen Tests mit p-Werten für . Für eine solche Familie können wir einen invertierten Zurückweisungsbereichλ(θ,x)θ∈Θ
Qα(x)={θ∈Θ:λ(θ,x)≤α}.
Für jedes feste ; wird abgelehnt, wenn ; , was genau dann geschieht, wenn & ; das heißt,
Wenn der Test auf einer Teststatistik mit einer vollständig spezifizierten absolut kontinuierlichen basiert, dann ist unter . Dann ist
Da diese Gleichung für jedesθ0H0(θ0)x∈Rα(θ0)θ0∈Qα(x)
x∈Rα(θ0)⇔θ0∈Qα(x).
λ(θ0,X)∼U(0,1)H0(θ0)Pθ0(X∈Rα(θ0))=Pθ0(λ(θ0,X)≤α)=α.
θ0∈Θund da die obige Gleichung impliziert, dass folgt, dass die Zufallsmenge den wahren Parameter mit der Wahrscheinlichkeit . Wenn das Komplement von , haben wir
für alle
was bedeutet, dass das Komplement der invertierten Zurückweisungsregion ein Konfidenzintervall für .
Pθ0(X∈Rα(θ0))=Pθ0(θ0∈Qα(X)),
Qα(x)θ0αQCα(x)Qα(x)θ0∈ΘPθ0(θ0∈QCα(X))=1−α,
1−αθ
Nachfolgend wird eine Abbildung gezeigt, die die Abstoßungsbereiche und Konfidenzintervalle zeigt, die dem Test für einen normalen Mittelwert für verschiedene Nullmittelwerte und verschiedene Stichprobenmittelwerte mit . wird verworfen, wenn im schattierten hellgrauen Bereich liegt. Dunkelgrau dargestellt ist der Zurückweisungsbereich und das Konfidenzintervall .
zθx¯σ=1H0(θ)(x¯,θ)R0.05(−0.9)=(−∞,−1.52)∪(−0.281,∞)I0.05(1/2)=QC0.05(1/2)=(−0.120,1.120)
(Ein Großteil davon stammt aus meiner Doktorarbeit .)
Nun zum "Nein"
Oben habe ich die Standardmethode zum Erstellen von Konfidenzintervallen beschrieben. In diesem Ansatz verwenden wir eine Statistik, die sich auf den unbekannten Parameter bezieht, um das Intervall zu konstruieren. Es gibt auch Intervalle, die auf Minimierungsalgorithmen basieren und versuchen, die Länge der Intervallbedingung für den Wert von zu minimieren . In der Regel entsprechen solche Intervalle keinem Test.θX
Dieses Phänomen hat mit Problemen zu tun, die damit zusammenhängen, dass solche Intervalle nicht verschachtelt sind, was bedeutet, dass das 94% -Intervall kürzer sein kann als das 95% -Intervall. Weitere Informationen hierzu finden Sie in Abschnitt 2.5 meines jüngsten Papiers (erscheint in Bernoulli).
Und ein zweites "Nein"
In einigen Fällen basiert das Standard-Konfidenzintervall nicht auf derselben Statistik wie der Standardtest (wie in diesem Artikel von Michael Fay erläutert ). In diesen Fällen liefern Konfidenzintervalle und Tests möglicherweise nicht dieselben Ergebnisse. Zum Beispiel kann vom Test zurückgewiesen werden, obwohl 0 im Konfidenzintervall enthalten ist. Dies widerspricht nicht dem obigen "Ja", da unterschiedliche Statistiken verwendet werden.θ0=0
Und manchmal ist "ja" keine gute Sache
Wie von f coppens in einem Kommentar hervorgehoben, haben Intervalle und Tests manchmal etwas widersprüchliche Ziele. Wir wollen kurze Intervalle und Tests mit hoher Leistung, aber das kürzeste Intervall entspricht nicht immer dem Test mit der höchsten Leistung. Für einige Beispiele dafür finden Sie dieses Papier (multivariate Normalverteilung), oder diese (Exponentialverteilung) oder § 4 meiner Arbeit .
Bayesianer können auch Ja und Nein sagen
Vor einigen Jahren habe ich hier eine Frage gestellt, ob eine Testintervalläquivalenz auch in der Bayes'schen Statistik existiert. Die kurze Antwort ist, dass bei Verwendung von Standard-Bayes'schen Hypothesentests die Antwort "nein" lautet. Wenn Sie das Testproblem ein wenig umformulieren, lautet die Antwort jedoch "Ja". (Meine Versuche, meine eigene Frage zu beantworten, wurden schließlich zu einer Zeitung !)