Ich glaube nicht, dass die meisten dieser Antworten die Frage allgemein beantworten. Sie beschränken sich auf den Fall, dass eine einfache Nullhypothese vorliegt und die Teststatistik eine invertierbare CDF aufweist (wie bei einer stetigen Zufallsvariablen mit einer streng ansteigenden CDF). Dies sind die Fälle, um die sich die meisten Menschen beim Z-Test und T-Test kümmern, obwohl man zum Testen eines binomischen Mittels (zum Beispiel) keine solche CDF hat. Was oben angegeben ist, erscheint mir für diese eingeschränkten Fälle richtig.
Wenn Nullhypothesen zusammengesetzt sind, sind die Dinge etwas komplizierter. Der allgemeinste Beweis für diese Tatsache, den ich unter Verwendung einiger Annahmen in Bezug auf Ablehnungsbereiche im zusammengesetzten Fall gesehen habe, ist in Lehmann und Romanos "Testing Statisitical Hypotheses", S. 63-64, zu finden. Ich werde versuchen, das folgende Argument wiederzugeben ...
Wir testen eine Nullhypothese gegen eine alternative Hypothese auf der Grundlage einer Teststatistik, die wir als Zufallsvariable . Es wird angenommen, dass die Teststatistik aus einer parametrischen Klasse stammt, dh , wobei ein Element der Familie der Wahrscheinlichkeitsverteilungen und ist ein Parameterraum. Die Nullhypothese und die Alternativhypothese bilden eine Partition von in diesem
H0H1XX∼PθPθP≡{Pθ∣θ∈Θ}ΘH0:θ∈Θ0H1:θ∈Θ1ΘΘ=Θ0∪Θ1
Dabei ist
Θ0∩Θ1=∅.
Das Ergebnis der Prüfung kann bezeichnet werden
,
wo für jede Menge definieren wir
Hier ist unser Signifikanzniveau, und bezeichnet den Ablehnungsbereich des Tests für das Signifikanzniveau .ϕα(X)=1Rα(X)
S1S(X)={1,0,X∈S,X∉S.
αRαα
Angenommen, die Zurückweisungsbereiche erfüllen die
wenn . In diesem Fall von verschachtelten Zurückweisungsbereichen ist es nützlich, nicht nur zu bestimmen, ob die Nullhypothese bei einem gegebenen Signifikanzniveau wird oder nicht , sondern auch das kleinste Signifikanzniveau zu bestimmen, für das die Nullhypothese zurückgewiesen würde. Diese Stufe wird als p-Wert bezeichnet ,
Diese Zahl gibt uns eine Vorstellung von wie stark die Daten (wie in der Teststatistik ) der Nullhypothese widersprechen . Rα⊂Rα′
α<α′αp^=p^(X)≡inf{α∣X∈Rα},
XH0
Angenommen, für etwas und . Es sei zusätzlich angenommen, dass die Zurückweisungsbereiche der oben angegebenen Verschachtelungseigenschaft gehorchen. Dann gilt folgendes:X∼Pθθ∈ΘH0:θ∈Θ0Rα
Wenn für alle , dann für ,
supθ∈Θ0Pθ(X∈Rα)≤α0<α<1θ∈Θ0Pθ(p^≤u)≤ufor all0≤u≤1.
Wenn für wir haben für alle , dann haben wir
θ∈Θ0Pθ(X∈Rα)=α0<α<1θ∈Θ0Pθ(p^≤u)=ufor all0≤u≤1.
Beachten Sie, dass diese erste Eigenschaft nur angibt, dass die falsch-positive Rate bei durch Zurückweisen gesteuert wird, wenn der p-Wert kleiner als , und die zweite Eigenschaft (unter der zusätzlichen Annahme) angibt, dass p-Werte unter der Null gleichmäßig verteilt sind Hypothese.uu
Der Beweis ist wie folgt:
Lassen Sie und nehmen Sie für alle . Dann haben wir per Definition von für alle . Aus der Monotonie und der Annahme folgt, dass für alle . Wenn wir , folgt, dass .θ∈Θ0supθ∈Θ0Pθ(X∈Rα)≤α0<α<1p^{p^≤u}⊂{X∈Rv}u<vPθ(p^≤u)≤Pθ(X∈Rv)≤vu<vv↘uPθ(p^≤u)≤u
Lassen Sie und nehmen Sie an, dass für alle . Dann , und aus der Monotonie folgt, dass . Unter Berücksichtigung von (1) folgt, dass . θ∈Θ0Pθ(X∈Rα)=α0<α<1{X∈Ru}⊂{p^(X)≤u}u=Pθ(X∈Ru)≤Pθ(p^≤u)Pθ(p^(X)≤u)=u
Es ist zu beachten, dass die Annahme in (2) nicht zutrifft, wenn eine Teststatistik diskret ist, selbst wenn die Nullhypothese eher einfach als zusammengesetzt ist. Nehmen wir zum Beispiel mit und . Das heißt, wirf eine Münze zehnmal um und teste, ob sie fair oder voreingenommen gegenüber Köpfen ist (als 1 codiert). Die Wahrscheinlichkeit, 10 Köpfe in 10 fairen Münzwürfen zu sehen, beträgt (1/2) ^ 10 = 1/1024. Die Wahrscheinlichkeit, 9 oder 10 Köpfe in 10 fairen Münzwürfen zu sehen, beträgt 11/1024. Für jedes ausschließlich zwischen 1/1024 und 11/1024 liegt, lehnen Sie die Null ab, wenn ist. Wir haben jedoch nicht das für diese Werte von wennX∼Binom(10,θ)H0:θ=.5H1:θ>0.5αX=10Pr(X∈Rα)=ααθ=0.5 . Stattdessen ist für ein solches . Pr(X∈Rα)=1/1024α