Es ist einfacher, zunächst den Fall durchzuarbeiten, in dem die Regressionskoeffizienten bekannt und die Nullhypothese daher einfach ist. Dann ist die ausreichende Statistik , wobei z der Rest ist; ihre Verteilung unter der Null ist auch ein Chi-Quadrat von skalierten σ 2 0 & Freiheitsgraden mit zu der Probengröße gleich n .T=∑z2zσ20n
Schreiben Sie das Verhältnis der Wahrscheinlichkeiten unter & σ = σ 2 auf und bestätigen Sie, dass es eine zunehmende Funktion von T für σ 2 > σ 1 ist :σ=σ1σ=σ2Tσ2>σ1
Die logarithmische Wahrscheinlichkeitsverhältnisfunktion ist , & direkt proportional zuTmit positivem Gradienten, wennσ2>σ1.
ℓ(σ2;T,n)−ℓ(σ1;T,n)=n2⋅[log(σ21σ22)+Tn⋅(1σ21−1σ22)]
Tσ2>σ1
Nach dem Karlin-Rubin-Theorem ist jeder der einseitigen Tests gegen H A : σ < σ 0 & H 0 : σ = σ 0 gegen H A : σ < σ 0 gleichmäßig am leistungsstärksten. Offensichtlich gibt es keinen UMP Test von H 0 : σ = σ 0 vs H A : σ & ne; σ 0 . Wie hier besprochenH0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ≠σ0Wenn Sie sowohl einseitige Tests als auch eine Mehrfachvergleichskorrektur durchführen, führt dies zu dem häufig verwendeten Test mit gleich großen Ablehnungsbereichen in beiden Schwänzen. Dies ist durchaus sinnvoll, wenn Sie behaupten, dass entweder oder σ ist < σ 0, wenn Sie die Null ablehnen.σ>σ0σ<σ0
Finden nächste das Verhältnis der Wahrscheinlichkeiten unter , die Maximum-Likelihood - Schätzung von σ & σ = σ 0 :σ=σ^σσ=σ0
Wie σ 2 = T ist die logWahrscheinlichkeitsverhältnisTeststatistikl( σ ;T,n)-l(σ0;T,n)=nσ^2=Tn
ℓ(σ^;T,n)−ℓ(σ0;T,n)=n2⋅[log(nσ20T)+Tnσ20−1]
Dies ist eine feine Statistik zur Quantifizierung, wie stark die Daten über H 0 : σ = σ 0 . Und Konfidenzintervalle, die sich aus der Invertierung des Likelihood-Ratio-Tests ergeben, haben die ansprechende Eigenschaft, dass alle Parameterwerte innerhalb des Intervalls eine höhere Wahrscheinlichkeit aufweisen als diejenigen außerhalb. Die asymptotische Verteilung des doppelten Log-Likelihood-Verhältnisses ist bekannt, aber für einen genauen Test müssen Sie nicht versuchen, die Verteilung zu berechnen. Verwenden Sie einfach die Schwanzwahrscheinlichkeiten der entsprechenden Werte von T in jedem Schwanz.HA:σ≠σ0H0:σ=σ0T
Wenn Sie keinen einheitlich leistungsstärksten Test haben können, möchten Sie vielleicht einen, der den Alternativen am nächsten kommt, die am leistungsstärksten sind. Bestimmen Sie die Ableitung der log-Likelihood-Funktion in Bezug auf - die Score-Funktion:σ
dℓ(σ;T,n)dσ=Tσ3−nσ
σ0H0:σ=σ0HA:σ≠σ0
αϕ(T)=1T<c1T>c2ϕ(T)=0
E(ϕ(T))E(Tϕ(T))=α=αET
Ein Plot hilft dabei, die Verzerrung im Gleichschwanzbereichstest zu zeigen und wie sie entsteht:
σσ0
Unparteilichkeit ist gut; Es ist jedoch nicht selbstverständlich, dass eine Leistung, die geringfügig unter der Größe eines kleinen Bereichs des Parameterraums in der Alternative liegt, so schlecht ist, dass ein Test insgesamt ausgeschlossen ist.
Zwei der oben genannten zweiseitigen Tests stimmen überein (in diesem Fall nicht generell):
Das LRT ist UMP unter den unvoreingenommene Tests. In Fällen, in denen dies nicht zutrifft, kann das LRT immer noch asymptotisch unvoreingenommen sein.
Ich denke, alle Tests, auch die einseitigen Tests, sind zulässig, dh es gibt keinen leistungsstärkeren oder unter allen Alternativen so leistungsfähigen Test. Sie können den Test gegenüber Alternativen in der einen Richtung leistungsstärker machen, indem Sie ihn gegenüber Alternativen in der anderen Richtung weniger leistungsfähig machen Richtung. Wenn die Stichprobengröße zunimmt, wird die Chi-Quadrat-Verteilung immer symmetrischer, und alle zweiseitigen Tests bleiben weitgehend gleich (ein weiterer Grund für die Verwendung des einfachen Tests mit gleichem Schwanz).
Mit der zusammengesetzten Nullhypothese werden die Argumente etwas komplizierter, aber ich denke, Sie können mutatis mutandis praktisch die gleichen Ergebnisse erzielen. Beachten Sie, dass einer der einseitigen Tests UMP ist, der andere jedoch nicht!