Warum ist der Freiheitsgrad für ein übereinstimmendes Paar Test die Anzahl der Paare minus 1?

Ich bin es gewohnt, "Freiheitsgrade" als , wobei Sie das lineare Modell mit , die Entwurfsmatrix mit Rang , , mit , . $n - r$

y = X β + ϵ

$\mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\epsilon}$

y \in R^{n}

$\mathbf{y} \in \mathbb{R}^n$

X \in M_{n \times p} (R)

$\mathbf{X} \in M_{n \times p}(\mathbb{R})$

r

$r$

β \in R^{p}

$\boldsymbol{\beta} \in \mathbb{R}^p$

ϵ \in R^{n}

$\boldsymbol{\epsilon} \in \mathbb{R}^n$

ϵ \sim N (0, σ^{2} I_{n})

$\boldsymbol{\epsilon} \sim \mathcal{N}(\mathbf{0}, \sigma^2 \mathbf{I}_n)$

σ^{2} > 0

$\sigma^2 > 0$

Soweit ich mich an die Elementarstatistik erinnere (dh vorlineare Modelle mit linearer Algebra), ist der Freiheitsgrad für den Matched-Pair- $t$ Test die Anzahl der Differenzen minus $1$ . Dies würde also bedeuten, dass $\mathbf{X}$ vielleicht Rang 1 hat. Ist das richtig? Wenn nicht, warum ist $n-1$ der Freiheitsgrad für den Matched-Pair- $t$ Test?

Angenommen, ich habe ein Modell mit gemischten Effekten

y_{i j k} = μ_{i} + some random effects + e_{i j k}

$y_{ijk} = \mu_i + \text{ some random effects} + e_{ijk}$ wobei

i = 1, 2

$i = 1, 2$ ,

j = 1, \dots, 8

$j = 1, \dots, 8$ und

k = 1, 2

$k = 1, 2$ . Es gibt nichts Besonderes an

μ_{i}

$\mu_i$ außer dass es ein fester Effekt ist und

e_{i j k} \overset{i i d}{\sim} N (0, σ_{e}^{2})

$e_{ijk} \overset{iid}{\sim}\mathcal{N}(0, \sigma^2_e)$ . Ich gehe davon aus, dass die zufälligen Effekte für dieses Problem irrelevant sind, da wir uns in diesem Fall nur um die festen Effekte kümmern.

Ich möchte ein Konfidenzintervall für $\mu_1 - \mu_2$ .

Ich habe bereits gezeigt, dass $\bar{d}_\cdot = \dfrac{1}{8}\sum d_j$ ein unvoreingenommener Schätzer von $\mu_1 - \mu_2$ , wobei $d_j = \bar{y}_{1j\cdot} - \bar{y}_{2j\cdot}$ , $\bar{y}_{1j\cdot} = \dfrac{1}{2}\sum_{k}y_{1jk}$ und $\bar{y}_{21\cdot}$ ist ähnlich definiert. Die Punktschätzung $\bar{d}_{\cdot}$ wurde berechnet.

Ich habe bereits gezeigt, dass

s_{d}^{2} = \frac{\sum_{j} (d_{j} - {\bar{d}}_{\cdot})^{2}}{8 - 1}

$s^2_d = \dfrac{\sum_{j}(d_j - \bar{d}_{\cdot})^2}{8-1}$ ein unvoreingenommener Schätzer der Varianz von

d_{j}

$d_j$ , und

ist

\sqrt{\frac{s_{d}^{2}}{8}}

$\sqrt{\dfrac{s^2_d}{8}}$ der Standardfehler von

{\bar{d}}_{\cdot}

$\bar{d}_{\cdot}$ . Dies wurde berechnet.

Jetzt geht es im letzten Teil darum, die Freiheitsgrade herauszufinden. Für diesen Schritt versuche ich normalerweise, die Entwurfsmatrix zu finden - die offensichtlich Rang 2 hat -, aber ich habe die Lösung für dieses Problem und es heißt, dass die Freiheitsgrade . $8-1$

Warum sind die Freiheitsgrade im Zusammenhang mit der Ermittlung des Ranges einer Entwurfsmatrix ? $8-1$

Bearbeitet, um hinzuzufügen: Vielleicht hilfreich in dieser Diskussion ist, wie die Teststatistik definiert wird. Angenommen, ich habe einen Parametervektor . In diesem Fall ist (es sei denn, ich vermisse etwas vollständig). Wir führen im Wesentlichen den Hypothesentest wobei . Dann ist die Teststatistik gegeben durch die gegen eine zentrale Verteilung mit getestet würden $\boldsymbol{\beta}$

β = [\begin{matrix} μ_{1} \\ μ_{2} \end{matrix}]

$\boldsymbol{\beta} = \begin{bmatrix} \mu_1 \\ \mu_2 \end{bmatrix}$

c^{'} β = 0

$\mathbf{c}^{\prime}\boldsymbol{\beta} = 0$

c^{'} = [\begin{matrix} 1 & - 1 \end{matrix}]

$\mathbf{c}^{\prime} = \begin{bmatrix} 1 & -1 \end{bmatrix}$

t = \frac{c^{'} \hat{β}}{\sqrt{{\hat{σ}}^{2} c^{'} (X^{'} X)^{- 1} c}}

$t = \dfrac{c^{\prime}\hat{\boldsymbol{\beta}}}{\sqrt{\hat{\sigma}^2c^{\prime}(\mathbf{X}^{\prime}\mathbf{X})^{-1}\mathbf{c}}}$

t

$t$

n - r

$n - r$ Freiheitsgrade, wobei die Entwurfsmatrix wie oben ist und wobei .

X

$\mathbf{X}$

{\hat{σ}}^{2} = \frac{y^{'} (I - P_{X}) y}{n - r}

$\hat{\sigma}^2 = \dfrac{\mathbf{y}^{\prime}(\mathbf{I}-\mathbf{P}_{\mathbf{X}})\mathbf{y}}{n-r}$

P_{X} = X (X^{'} X)^{- 1} X^{'}

$\mathbf{P}_{\mathbf{X}} = \mathbf{X}(\mathbf{X}^{\prime}\mathbf{X})^{-1}\mathbf{X}^{\prime}$

t-test degrees-of-freedom

— Klarinettist
quelle

Antworten:

Der Matched-Pair- Test mit Paaren ist eigentlich nur ein One-Sample- Test mit einer Stichprobe der Größe . Sie haben Unterschiede , und diese sind iid und normal verteilt. Die erste Spalte nach hat $t$ $n$ $t$ $n$ $n$ $d_1,\ldots,d_n$

\begin{array}{ccccc} [\begin{matrix} d_{1} \\ ⋮ \\ d_{n} \end{matrix}] & = & [\begin{matrix} \bar{d} \\ ⋮ \\ \bar{d} \end{matrix}] & + & [\begin{matrix} d_{1} - \bar{d} \\ ⋮ \\ d_{1} - \bar{d} \end{matrix}] \\ n d.f. & 1 d.f. & (n - 1) d.f. \end{array}

$\begin{array}{ccccc} \begin{bmatrix} d_1 \\ \vdots \\ d_n \end{bmatrix} & = & \begin{bmatrix} \bar d \\ \vdots \\ \bar d \end{bmatrix} & + & \begin{bmatrix} d_1 - \bar d \\ \vdots \\ d_1 - \bar d \end{bmatrix} \\[10pt] n \text{ d.f.} & & 1 \text{ d.f.} & & (n-1) \text{ d.f.} \end{array}$

“ =''

$\text{“}{=}\text{''}$

1

$1$ Freiheitsgrad aufgrund der linearen Einschränkung, die besagt, dass alle Einträge gleich sind; Die zweite hat Freiheitsgrade aufgrund der linearen Einschränkung, die besagt, dass die Summe der Einträge .

n - 1

$n-1$

0

$0$

— Michael Hardy
quelle

Mit anderen Worten, der Grund, warum wir hier Freiheitsgrade haben, hat nichts mit dem linearen Modell zu tun ?

n - 1

$n-1$

y = X β + ϵ

$\mathbf{y}=\mathbf{X}\boldsymbol{\beta}+\boldsymbol{\epsilon}$

— Klarinettist

Es hat mit diesem Modell zu tun, bei dem die Matrix eine Spalte von s ist und eine Matrix ist, deren einziger Eintrag die Differenz zwischen den beiden Populationsmitteln ist.

X

$\mathbf X$

1

$1$

β

$\boldsymbol{\beta}$

1 \times 1

$1\times1$

$\qquad$

— Michael Hardy

Aha! Ihr -Vektor wäre also der Vektor von s, richtig? Vielen Dank! Ich kann nicht glauben, wie schwer es war, eine Antwort darauf zu finden!

y

$\mathbf{y}$

d_{i}

$d_i$

— Klarinettist

Ja. Es ist der Vektor der beobachteten Unterschiede in den übereinstimmenden Paaren.

n

$n$

$\qquad$

— Michael Hardy

Vielen, vielen Dank an Michael Hardy für die Beantwortung meiner Frage.

Die Idee ist folgende: Lassen Sie und . Dann ist unser lineares Modell wobei ist der Vektor aller und Offensichtlich hat Rang , also haben wir Freiheitsgrade .

y = [\begin{matrix} d_{1} \\ ⋮ \\ d_{n} \end{matrix}]

$\mathbf{y} = \begin{bmatrix} d_1 \\ \vdots \\ d_n \end{bmatrix}$

β = [μ_{1} - μ_{2}]

$\boldsymbol{\beta} = [\mu_1 - \mu_2]$

y = 1_{n \times 1} β + ϵ

$\mathbf{y} = \mathbf{1}_{n \times 1}\boldsymbol{\beta} + \boldsymbol{\epsilon}$

1_{n \times 1}

$\mathbf{1}_{n \times 1}$

n

$n$

ϵ = [\begin{matrix} ϵ_{1} \\ ⋮ \\ ϵ_{n} \end{matrix}] \sim N (0, σ^{2} I_{n}) .

$\boldsymbol{\epsilon} = \begin{bmatrix} \epsilon_1 \\ \vdots \\ \epsilon_n \end{bmatrix} \sim \mathcal{N}(\mathbf{0}, \sigma^2\mathbf{I}_n)\text{.}$

X = 1_{n \times 1}

$\mathbf{X} = \mathbf{1}_{n \times 1}$

1

$1$

n - 1

$n-1$

Woher wissen wir, dass gleich ? Denken Sie daran, dass und wie leicht zu sehen ist, für alle . Angesichts unseres ist es offensichtlich, was sein sollte. Das ist weil $\boldsymbol{\beta}$ $[\mu_1 - \mu_2]$

E [y] = X β

$\mathbb{E}[\mathbf{y}] = \mathbf{X}\boldsymbol{\beta}$

E [d_{j}] = μ_{1} - μ_{2}

$\mathbb{E}[d_j] = \mu_1 - \mu_2$

j

$j$

X

$\mathbf{X}$

β

$\boldsymbol{\beta}$

E [y] = E [[\begin{matrix} d_{1} \\ ⋮ \\ d_{n} \end{matrix}]] = [\begin{matrix} E [d_{1}] \\ ⋮ \\ E [d_{n}] \end{matrix}] = [\begin{matrix} μ_{1} - μ_{2} \\ ⋮ \\ μ_{1} - μ_{2} \end{matrix}] = X β = 1_{n \times 1} β = [\begin{matrix} 1 \\ ⋮ \\ 1 \end{matrix}] β

$\mathbb{E}[\mathbf{y}] = \mathbb{E}\left[\begin{bmatrix} d_1 \\ \vdots \\ d_n \end{bmatrix} \right] = \begin{bmatrix} \mathbb{E}[d_1] \\ \vdots \\ \mathbb{E}[d_n] \end{bmatrix} = \begin{bmatrix} \mu_1 - \mu_2 \\ \vdots \\ \mu_1 - \mu_2 \end{bmatrix} = \mathbf{X}\boldsymbol\beta = \mathbf{1}_{n \times 1}\boldsymbol\beta = \begin{bmatrix} 1 \\ \vdots \\ 1 \end{bmatrix}\boldsymbol\beta$ so sollte eine Matrix mit .

β

$\boldsymbol\beta$

1 \times 1

$1 \times 1$

β = [μ_{1} - μ_{2}]

$\boldsymbol\beta = [\mu_1 - \mu_2]$

Setze . Dann lautet unser Hypothesentest Unsere Teststatistik lautet also Wir haben Nach einiger Arbeit kann gezeigt werden, dass Es kann auch gezeigt werden, dass $\mathbf{c}^{\prime} = [1]$

H_{0} : c^{'} β = 0 .

$H_0: \mathbf{c}^{\prime}\boldsymbol{\beta} = 0\text{.}$

\frac{c^{'} \hat{β}}{\sqrt{{\hat{σ}}^{2} c^{'} {(X^{'} X)}^{- 1} c}} .

$\dfrac{\mathbf{c}^{\prime}\hat{\boldsymbol{\beta}}}{\sqrt{\hat{\sigma}^2\mathbf{c}^{\prime}\left(\mathbf{X}^{\prime}\mathbf{X}\right)^{-1}\mathbf{c}}}\text{.}$

{\hat{σ}}^{2} = \frac{y^{'} (I - P_{X}) y}{n - r (X)} .

$\hat{\sigma}^2 = \dfrac{\mathbf{y}^{\prime}(\mathbf{I}-\mathbf{P}_{\mathbf{X}})\mathbf{y}}{n-r(\mathbf{X})}\text{.}$

P_{X} = P_{1_{n \times 1}} = 1_{n \times 1} (\frac{1}{n}) 1^{'} .

$\mathbf{P}_\mathbf{X} = \mathbf{P}_{\mathbf{1}_{n \times 1}} = \mathbf{1}_{n \times 1}\left(\dfrac{1}{n}\right)\mathbf{1}^{\prime}\text{.}$

I - P_{X}

$\mathbf{I}-\mathbf{P}_{\mathbf{X}}$ ist symmetrisch und idempotent. Also, und

\begin{aligned} {\hat{σ}}^{2} & = \frac{y^{'} (I - P_{X}) y}{n - r (X)} \\ = \frac{y^{'} (I - P_{X})^{'} (I - P_{X}) y}{n - r (X)} \\ = \frac{‖ (I - P_{X}) y ‖^{2}}{n - r (X)} \\ = \frac{{‖ [I - 1_{n \times 1} (\frac{1}{n}) 1^{'}] y ‖}^{2}}{n - 1} \\ = \frac{{‖ [\begin{matrix} d_{1} \\ ⋮ \\ d_{n} \end{matrix}] - [\begin{matrix} {\bar{d}}_{\cdot} \\ ⋮ \\ {\bar{d}}_{\cdot} \end{matrix}] ‖}^{2}}{n - 1} \\ = \frac{\sum_{i = 1}^{n} (d_{i} - {\bar{d}}_{\cdot})^{2}}{n - 1} \\ = s_{d}^{2} \end{aligned}

$\begin{align} \hat{\sigma}^2 &= \dfrac{\mathbf{y}^{\prime}(\mathbf{I}-\mathbf{P}_{\mathbf{X}})\mathbf{y}}{n-r(\mathbf{X})} \\ &= \dfrac{\mathbf{y}^{\prime}(\mathbf{I}-\mathbf{P}_{\mathbf{X}})^{\prime}(\mathbf{I}-\mathbf{P}_{\mathbf{X}})\mathbf{y}}{n-r(\mathbf{X})} \\ &= \dfrac{\|(\mathbf{I}-\mathbf{P}_{\mathbf{X}})\mathbf{y}\|^{2}}{n-r(\mathbf{X})} \\ &=\dfrac{\left\|\left[\mathbf{I}-\mathbf{1}_{n \times 1}\left(\dfrac{1}{n}\right)\mathbf{1}^{\prime}\right]\mathbf{y} \right\|^2}{n-1} \\ &= \dfrac{\left\|\begin{bmatrix} d_1 \\ \vdots \\ d_n \end{bmatrix} - \begin{bmatrix} \bar{d}_\cdot \\ \vdots \\ \bar{d}_\cdot \end{bmatrix} \right\|^2}{n-1} \\ &= \dfrac{\sum_{i=1}^{n}(d_i-\bar{d}_{\cdot})^2}{n-1} \\ &= s^2_d \end{align}$

X^{'} X = 1_{n \times 1}^{'} 1_{n \times 1} = n

$\mathbf{X}^{\prime}\mathbf{X} = \mathbf{1}_{n \times 1}^{\prime}\mathbf{1}_{n \times 1} = n$ was offensichtlich hat inverses , wodurch eine Teststatistik die auf einer zentralen Verteilung mit Grad von getestet würde Freiheit wie gewünscht.

1 / n

$1/n$

\frac{{\hat{μ}}_{1} - {\hat{μ}}_{2}}{\sqrt{s_{d}^{2} / n}}

$\dfrac{\hat\mu_1-\hat\mu_2}{\sqrt{s^2_d/n}}$

t

$t$

n - 1

$n - 1$

— Klarinettist
quelle