Mit dem allgemeinen linearen Modell können wir ein ANOVA-Modell als Regressionsmodell schreiben. Nehmen wir an, wir haben zwei Gruppen mit jeweils zwei Beobachtungen, dh vier Beobachtungen in einem Vektor y . Dann ist das ursprüngliche, überparametrisierte Modell E(y)=X⋆β⋆ , wobei X⋆ die Matrix von Prädiktoren ist, dh Dummy-codierte Indikatorvariablen:
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜111111000011⎞⎠⎟⎟⎟⎛⎝⎜β⋆0β⋆1β⋆2⎞⎠⎟
Die Parameter sind nicht als identifizierbar, da X ⋆ Rang 2 hat ( ( X ⋆ ) ' X ⋆ ist nicht invertierbar). Um dies zu ändern, führen wir die Bedingung β ⋆ 1 = 0 (Behandlungskontraste) ein, die uns das neue Modell E ( y ) = X β gibt :
(((X⋆)′X⋆)−1(X⋆)′E(y)X⋆(X⋆)′X⋆β⋆1= 0E( y) = Xβ
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜11110011⎞⎠⎟⎟⎟(β0β2)
So , dh ß 0 nimmt die Bedeutung des Erwartungswertes aus unserer Referenzkategorie (Gruppe 1). μ 2 = β 0 + β 2 , dh β 2 nimmt die Bedeutung der Differenz μ 2 - μ 1 zur Referenzkategorie an. Da mit zwei Gruppen nur ein Parameter mit dem Gruppeneffekt verknüpft ist, entspricht die ANOVA-Nullhypothese (alle Gruppeneffektparameter sind 0) der Regressionsgewicht-Nullhypothese (der Steigungsparameter ist 0).μ1=β0β0μ2=β0+β2β2μ2−μ1
Ein Test im allgemeinen linearen Modell testet eine Linearkombination ψ = ∑ c j β j der Parameter gegen einen hypothetischen Wert ψ 0 unter der Nullhypothese. Wenn wir c = ( 0 , 1 ) ' wählen, können wir die Hypothese prüfen, dass β 2 = 0 (der übliche Test für den Steigungsparameter) ist, dh hier gilt μ 2 - μ 1 = 0 . Der Schätzer ist ψ = Σ C jtψ=∑cjβjψ0c=(0,1)′β2=0μ2−μ1=0, wobei β =(X'X)-1X'ydie OLS Schätzwerte für die Parameter sind. Die allgemeine Teststatistik für solcheψist:
t= ψ -ψ0ψ^=∑cjβ^jβ^=(X′X)−1X′yψ
t=ψ^−ψ0σ^c′(X′X)−1c−−−−−−−−−√
ist ein unverzerrter Schätzer für die Fehlervarianz, wo‖e‖2ist die Summe der quadrierten Residuen. Im Fall von zwei GruppenRank(X)=2,(X'X)-1X'=( .5 .5 0 0 -σ^2=∥e∥2/(n−Rank(X))∥e∥2Rank(X)=2und die Schätzer sind somit β 0=0,5y1+0,5y2=M1und β 2=-0,5y1-0,5y2+0,5y3+0,5y4=M2-M1. Mitc'(X'X)-(X′X)−1X′=(.5−.5.5−.50.50.5)β^0=0.5y1+0.5y2=M1β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1c′(X′X)−1c being 1 in our case, the test statistic becomes:
t=M2−M1−0σ^=M2−M1∥e∥2/(n−2)−−−−−−−−−−√
t is t-distributed with n−Rank(X) df (here n−2). When you square t, you get (M2−M1)2/1∥e∥2/(n−2)=SSb/dfbSSw/dfw=F, the test statistic from the ANOVA F-test for two groups (b for between, w for within groups) which follows an F-distribution with 1 and n−Rank(X) df.
With more than two groups, the ANOVA hypothesis (all βj are simultaneously 0, with 1≤j) refers to more than one parameter and cannot be expressed as a linear combination ψ, so then the tests are not equivalent.