Wir haben einige multivariate Daten , die aus einer Verteilung D mit einem unbekannten Parameter θ stammen . Beachten Sie, dass x Stichprobenergebnisse sind.xDθx
Wir wollen eine Hypothese über einen unbekannten Parameter testen , die Werte von θ unter der Nullhypothese liegen in der Menge θ 0 .θθθ0
Im Raum des können wir einen Zurückweisungsbereich R definieren , und die Leistung dieses Bereichs R wird dann definiert als P R ˉ θ = P ˉ θ ( x ∈ R ) . So dass die Leistung wird berechnet für einen bestimmten Wert ˉ θ von θ als die Wahrscheinlichkeit , dass die Probe Ergebnis x in der Verwerfungsbereich ist R , wenn der Wert von θ ist ˉ θ . Offensichtlich hängt die Leistung von der Region R abXRRPRθ¯=Pθ¯(x∈R)θ¯θxR θθ¯Rund auf dem gewählten .θ¯
Definition 1 definiert die Größe des Bereichs R als das Supremum aller Werte von für ˉ θ in θ 0 , also nur für Werte von ˉ θ unter H 0 . Offensichtlich ist dies abhängig von der Region, so α R = s u p ˉ & thgr; ∈ & thgr; 0 P R ˉ & thgr; .PRθ¯θ¯θ0θ¯H0αR=supθ¯∈θ0PRθ¯
Als abhängt R haben wir einen anderen Wert , wenn die Region ändert, und dies ist die Grundlage , um die p-Wert für die Definition: Änderung der Region, aber in einer Weise , dass die Probe noch beobachteten Wert in der Region gehört, für jede dieser Region, berechne das α R wie oben definiert und nimm das Infimum: p v ( x ) = i n f R | x ∈ R α R . Der p-Wert ist also die kleinste Größe aller Regionen, die x enthalten .αRRαRpv(x)=infR|x∈RαRx
Der Satz ist dann nur eine 'Übersetzung' davon, nämlich der Fall, in dem die Regionen unter Verwendung einer Statistik T definiert werden und für einen Wert c eine Region R als R = { x | definiert wird T ( x ) ≥ c } . Wenn Sie diese Art von Region R in der obigen Argumentation verwenden, folgt der Satz.RTcRR={x|T(x)≥c}R
BEARBEITEN wegen Kommentaren:
@ user8: für den Satz; Wenn Sie Ablehnungsbereiche wie im Satz definieren, ist ein Zurückweisungsbereich der Größe eine Menge, die wie folgt aussieht: R α = { X | T ( X ) ≥ c α } für einige c α .αRα={X|T(X)≥cα}cα
Um den p-Wert eines beobachteten Wertes , dh p v ( x ) , müssen Sie den kleinsten Bereich R finden , dh den größten Wert von c, so dass { X | T ( X ) ≥ c } enthält immer noch x , letzteres (die Region enthält x ) entspricht (aufgrund der Art und Weise, wie die Regionen definiert sind) der Aussage, dass c ≥ T ( x ) ist , so dass Sie das größte c wie z dass { X | T.xpv(x)Rc{X|T(X)≥c} xxc≥T(x)c{X|T(X)≥c&c≥T(x)}
Offensichtlich ist der größte , so dass c ≥ T ( x ) sollte sein c = T ( x ) und dann der Satz über wird { X | T ( X ) ≥ c = T ( x ) } = { X | T ( X ) ≥ T ( x ) }cc≥T(x)c=T(x){X|T(X)≥c=T(x)}={X|T(X)≥T(x)}