Sind t-Test und Einweg-ANOVA beide Wald-Tests?


11

Der t-Test zum Testen, ob der Mittelwert einer normalverteilten Stichprobe einer Konstanten entspricht, wird als Wald-Test bezeichnet, indem die Standardabweichung des Stichprobenmittelwerts anhand der Informationen des Fischers über die Normalverteilung beim Stichprobenmittelwert geschätzt wird. Die Teststatistik im t-Test hat jedoch eine Schüler-t-Verteilung, während die Teststatistik in einem Wald-Test asymptotisch eine Chi-Quadrat-Verteilung aufweist. Ich frage mich, wie ich das erklären soll.

In der Einweg-ANOVA wird die Teststatistik als das Verhältnis zwischen der Varianz zwischen Klassen und der Varianz innerhalb der Klasse definiert. Ich habe mich gefragt, ob es auch ein Wald-Test ist? Die Teststatistik in der Einweg-ANOVA hat jedoch eine F-Verteilung, und die Teststatistik in einem Wald-Test hat asymptotisch eine Chi-Quadrat-Verteilung. Ich frage mich, wie ich das erklären soll.

Danke und Grüße!

Antworten:


16

Betrachten Sie das folgende Setup. Wir haben einen -dimensionale Parametervektor θ , der angibt , das Modell vollständig und ein Maximum-Likelihood - Schätzer θ . Die Fisher-Information in θ wird mit I ( θ ) bezeichnet . Was normalerweise als Wald-Statistik bezeichnet wird, istpθθ^θI(θ)

(θ^θ)TI(θ^)(θ^θ)

wo ist , die ausgewertete Fisher Informationen in der Maximum-Likelihood - Schätzer. Unter Regelmäßigkeitsbedingungen folgt die Wald-Statistik asymptotisch einer χ 2 -Verteilung mit p- Freiheitsgraden, wenn θ der wahre Parameter ist. Die Wald-Statistik kann verwendet werden, um eine einfache Hypothese H 0 zu testen : θ = θ 0 für den gesamten Parametervektor.I(θ^)χ2pθH0:θ=θ0

Mit die Inverse der Fisher Informationen Wald Prüfgröße der Hypothese H 0 : θ 1 = θ 0 , 1 ist ( θ 1 - θ 0 , 1 ) 2Σ(θ)=ich(θ)- -1H.0::θ1=θ0,1 Seine asymptotische Verteilung ist eineχ2-Verteilung mit 1 Freiheitsgraden.

(θ^1- -θ0,1)2Σ(θ^)ichich.
χ2

Für das normale Modell, bei dem der Vektor des Mittelwerts und der Varianzparameter ist, ist die Wald-Teststatistik des Testens, wenn μ = μ 0 ist, nθ=(μ,σ2)μ=μ0 mitnder Probengröße. Hierσ2ist der Maximum-LikelihoodSchätzer fürσ2(wo man durch dividierenn). Diet-Test-Statistik ist

n(μ^μ0)2σ^2
nσ^2σ2nt wobeis2der unverzerrte Schätzer der Varianz ist (wobei Sie durchn-1dividieren). Die Wald-Teststatistik ist fast, aber nicht genau gleich dem Quadrat dert-Teststatistik, aber sie sind asymptotisch äquivalent, wennn. Die quadratischet-Test-Statistik hat eine exakteF(1,n-1)-Verteilung, diemit 1 Freiheitsgraden fürnzurχ2-Verteilungkonvergiert.
n(μ^μ0)s
s2n1tntF(1,n1)χ2n

Die gleiche Geschichte gilt für den Test in der Einweg-ANOVA.F


Vielen Dank! Ich habe gerade festgestellt, dass die t-Teststatistik direkt auf der Likelihood-Ratio-Teststatistik basiert, nicht auf der Wald-Teststatistik. Baut die Einweg-ANOVA direkt auf dem Likelihood-Ratio-Test auf?
Tim

3
F

Vielen Dank! Unter dem normalen statistischen Modell sagen einige auch, dass die Verteilung einer geringfügigen Modifikation der Wald-Teststatistik eine F-Verteilung unter Null hat. Ist das wahr? Ich poste eine Frage hier
Tim

13

@NRH gab eine gute theoretische Antwort, hier ist eine, die einfacher und intuitiver sein soll.

n vs. n- -1innerhalb einer Quadratwurzel). Wir könnten sogar einen Wald-Style-Test entwerfen, der auf einem geschätzten Median abzüglich des hypothetischen Medians geteilt durch eine Funktion des IQR basiert, aber ich weiß nicht, welcher Verteilung er folgen würde. Es wäre besser, einen Bootstrap, eine Permutation oder eine Simulation zu verwenden Verteilung für diesen Test und nicht abhängig von Chi-Quadrat-Asymptotika. Der F-Test für ANOVA passt auch zum allgemeinen Muster, der Zähler kann als Messung der Differenz der Mittelwerte von einem Gesamtmittelwert angesehen werden und der Nenner ist ein Maß für die Variation.

Beachten Sie auch, dass, wenn Sie eine Zufallsvariable quadrieren, die bei der Verteilung folgt, sie einer F-Verteilung mit 1 df für den Zähler folgt und der Nenner df diejenigen aus der t-Verteilung sind. Beachten Sie auch, dass eine F-Verteilung mit unendlichem Nenner df eine Chi-Quadrat-Verteilung ist. Das bedeutet, dass sowohl die t-Statistik (im Quadrat) als auch die F-Statistik genau wie die Wald-Statistik asymptotisch im Chi-Quadrat sind. In der Praxis verwenden wir nur die genauere Verteilung.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.