Warum ist der F-Test in linearen Gauß-Modellen am leistungsfähigsten?

Für ein lineares Gauß-Modell $Y=\mu+\sigma G$ bei dem angenommen wird, dass $\mu$ in einem Vektorraum $W$ und $G$ die Standardnormalverteilung auf $\mathbb{R}^n$ , ist die Statistik des $F$ Tests für $H_0\colon\{\mu \in U\}$ wobei $U \subset W$ ist ein Vektorraum, eine zunehmende Eins-zu-Eins-Funktion der Abweichungsstatistik : Woher wissen wir, dass diese Statistik den leistungsstärksten Test fürliefert(möglicherweise nachdem ungewöhnliche Sonderfälle verworfen wurden)? Dies ergibt sich nicht aus dem Neyman-Pearson-Theorem, da dieses Theorem besagt, dass der Likelihood-Ratio-Test für Punkthypothesenam leistungsfähigsten istund

f = ϕ (2 \log \frac{sup_{μ \in W, σ > 0} L (μ, σ | y)}{sup_{μ \in U, σ > 0} L (μ, σ | y)}) .

$f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} L(\mu, \sigma | y)}{\sup_{\mu \in U, \sigma>0} L(\mu, \sigma | y)} \right).$

H_{0}

$H_0$

H_{0} : {μ = μ_{0}, σ = σ_{0}}

$H_0\colon\{\mu=\mu_0, \sigma=\sigma_0\}$

H_{1} : {μ = μ_{1}, σ = σ_{1}}

$H_1\colon\{\mu=\mu_1,\sigma=\sigma_1\}$

— Stéphane Laurent
quelle

MLR-Familien und der Karlin-Rubin-Satz könnten hier relevant sein.

— Whuber

Sie können

so umschreiben , dass es eine Form wie

H_{0} : μ \in U

$H_0: \mu\in U$

(entgegen der Alternative, dass es nicht 0 ist). Im Wesentlichen wird sich

H_{0} : δ = 0

$H_0:\delta=\mathbf 0$

δ

$\delta$

W / U

$W/U$

— 0:17 Uhr

@ Glen_b Und dann meinst du, dass Neyman-Pearson-Theorem die Schlussfolgerung liefert?

— Stéphane Laurent

Ich bin kein Experte für dieses Material, und es wird wahrscheinlich etwas Wichtiges geben, das ich verpasst habe, aber ich denke, Neyman & Pearsons Artikel diskutiert Hypothesen, die andere nicht spezifizierte Parameter als die im Test genannten enthalten. Das ist wahrscheinlich einen Blick wert.

— Glen_b

Dear @ StéphaneLaurent: Wir können das nicht wissen, weil es nicht wahr ist.

— Kardinal

Ich bin dieser Frage seit einiger Zeit nachgegangen, in der Hoffnung, dass jemand mit einem tieferen Einblick in die klassische Testtheorie erklären könnte, warum dieser Test im Allgemeinen nicht einheitlich am leistungsfähigsten ist so wie @cardinal in einem Kommentar schreibt. Es ist eine Folklore, dass einheitlich leistungsfähigste Tests nur für einseitige Hypothesen zu univariaten Parametern konstruiert werden können, aber ein solcher Kommentar beantwortet die Frage nicht wirklich. $F$ $-$

Beispiel 5.5 in Theoretical Statistics von Cox und Hinkley zeigt, dass die $t$ Test ein einheitlich leistungsstärkster ähnlicher Test für einen univariaten Mittelwert mit unbekannter Varianz ist. Unter Bezugnahme auf Techniken in The Analysis of Varianz von Scheffé behauptet dasselbe Beispiel, dass der Test einer Hypothese zu einem Parameter im multivariaten Fall immer noch ein einheitlich leistungsstärkster ähnlicher Test ist, wobei die übrigen Parameter und die Varianz als Störparameter gelten. Wenn die Codimension von 1 ist, entspricht der Test einem Test. $t$ $U$ $F$ $t$

Beispiel 5.20, immer noch in Cox und Hinkley, betrachtet eine Einweg-ANOVA. Es wird argumentiert, dass es im Fall von mindestens drei Gruppen keinen einheitlich leistungsstärksten ähnlichen Test für die Hypothese gibt, dass es keine Unterschiede zwischen den Gruppen gibt. Dies liefert die Zutaten, um zu zeigen, dass der Test nicht einheitlich am leistungsfähigsten ist, da es für bestimmte Alternativen leistungsfähigere Tests gibt. Der Test ist jedoch der gleichmäßig leistungsstärkste Invariantentest . $F$ $t$ $F$

Was bedeutet also ähnlich und invariant ? Eine verschachtelte Folge von kritischen Bereichen für Tests der Grße wird alsähnlich bezeichnet,wenn die Wahrscheinlichkeit einer Zurückweisung gemäß der Hypothese (für alle möglichen Auswahlen von Störparametern). Der Test istinvariant,wenn die kritischen Bereiche unter einer Gruppe von Transformationen invariant sind. Für die Einweg-ANOVA ist die Gruppe eine Gruppe von orthogonalen Transformationen. Ich empfehle, Kapitel 5 in Cox und Hinkley zu lesen, um weitere Einzelheiten zu erfahren. Siehe auch Abschnitt 2.10 in Scheffés Buch über die optimalen Eigenschaften des Tests. $\alpha \in [0,1]$ $\alpha$ $F$

— NRH
quelle