Verteilung des Verhältnisses abhängiger Chi-Quadrat-Zufallsvariablen

Angenommen, $X = X_1 + X_2+\cdots+ X_n$ wobei $X_i \sim N(0,\sigma^2)$ unabhängig sind.

Meine Frage ist, was Distribution macht

Z = \frac{X^{2}}{X_{1}^{2} + X_{2}^{2} + \dots + X_{n}^{2}}

$Z = \frac{X^2}{X_1^2 + X_2^2 + \cdots + X_n^2}$

Folgen? Ich weiß von hier, dass das Verhältnis zweier Chi-Quadrat-Zufallsvariablen als ausgedrückt wird $\frac{W}{W + Y}$ folgt einer Beta-Verteilung. Ich denke, dass dies die Unabhängigkeit zwischen $W$ undvoraussetzt $Y$ . In meinem Fallenthält derNenner von $Z$ die Komponenten von $X$ Quadrat.

Ich denke, $Z$ muss auch einer Variation der Beta-Distribution folgen, bin mir aber nicht sicher. Und wenn diese Annahme richtig ist, weiß ich nicht, wie ich es beweisen soll.

— x0dros
quelle

Da die Verteilung des Nenners bei Rotationen unveränderlich ist, können Sie

auf

drehen

X

$X$

, was Ihre Frage auf etwas Vertrautes reduziert :-).

\sqrt{n} X_{1}

$\sqrt{n}X_1$

— whuber

Ich bin mir ziemlich sicher, dass @whuber genau das bedeutet, was dort eingegeben wurde. Wenn Sie "Nominator" sagen, meinen Sie "Zähler"?

— Glen_b -State Monica am

Wenn Sie etwas drehen, behalten Sie (per Definition) seine Länge bei. Daher muss die Varianz einer gedrehten Version von

gleich der Varianz von

, die

X

$X$

X

$X$

: dort ist das

1 + 1 + \dots + 1 = n

$1+1+\cdots+1=n$

Begriff kommt von.

\sqrt{n}

$\sqrt{n}$

— whuber

@whuber Deine Antwort scheint in der Tat sehr interessant zu sein, aber ich habe einige Zweifel. Wenn Sie sagen, dass ich

drehen kann , um gleich

X

$X$

bedeutet dies im Grunde, dass ich den Zähler von

als

umschreiben kannund folglich

selbst zu

\sqrt{n} X_{1}

$\sqrt nX_1$

Z

$Z$

n X_{1}^{2}

$nX_1^2$

Z

$Z$

. Wenn ich nun

und

unabhängig sind, kann ich annehmen, dass

n \frac{X_{1}^{2}}{X_{1}^{2} + X_{2}^{2} + \dots + X_{n}^{2}}

$n\frac{X_1^2}{X_1^2+X_2^2+\cdots+X_n^2}$

W = X_{1}^{2}

$W=X_1^2$

Y = X_{2}^{2} + \dots + X_{n}^{2}

$Y=X_2^2+\cdots+X_n^2$

W

$W$

Y

$Y$

hat eine

Verteilung und so weiter. Verstehe ich Ihren Standpunkt bis jetzt? Also, hier ist meine Verwirrung. VorVerwendung des Begriffs Drehinvarianz und modifyi

Z = n \frac{W}{W + Y}

$Z=n\frac{W}{W+Y}$

β

$\beta$

— ssah

@ssah Sie irren sich in Ihrer Anwendung meiner Argumentation: Ohne das

im Nenner ist seine Verteilung nicht länger unveränderlich für willkürliche Rotationen von

und daher gelten die Schlussfolgerungen nicht mehr.

X_{1}^{2}

$X_1^2$

(X_{1}, \dots, X_{n}),

$(X_1,\ldots, X_n),$

— whuber

In diesem Beitrag werden die Antworten in den Kommentaren zur Frage erläutert.

Sei . Fixiere jedes der Längeneinheit. Ein solcher Vektor kann immer orthonormal vervollständigt werden ( zum Beispiel mittels des Gram-Schmidt-Prozesses ). Diese Änderung der Basis (von der üblichen) ist orthogonal: Sie ändert die Längen nicht. So ist die Verteilung von $X = (X_1, X_2, \ldots, X_n)$ $\mathbf{e}_1\in\mathbb{R}^n$ $(\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n)$

\frac{(e_{1} \cdot X)^{2}}{| | X | |^{2}} = \frac{(e_{1} \cdot X)^{2}}{X_{1}^{2} + X_{2}^{2} + \dots + X_{n}^{2}}

$\frac{(\mathbf{e}_1\cdot X)^2}{||X||^2}=\frac{(\mathbf{e}_1\cdot X)^2}{X_1^2 + X_2^2 + \cdots + X_n^2}$

hängt nicht von . Die Annahme von zeigt, dass dies die gleiche Verteilung wie hat $\mathbf{e}_1$ $\mathbf{e}_1 = (1,0,0,\ldots, 0)$

\begin{matrix} (1) & \frac{X_{1}^{2}}{X_{1}^{2} + X_{2}^{2} + \dots + X_{n}^{2}} . \end{matrix}

$\frac{X_1^2}{X_1^2 + X_2^2 + \cdots + X_n^2}.\tag{1}$

Da der Normale iid werden, können sie geschrieben werden als - mal iid Standard - Normalvariablen und deren Quadrate sind mal Verteilungen. Da die Summe von unabhängig Verteilungen ist $X_i$ $\sigma$ $Y_1, \ldots, Y_n$ $\sigma^2$ $\Gamma(1/2)$ $n-1$ $\Gamma(1/2)$ $\Gamma((n-1)/2)$ haben wir festgestellt, dass die Verteilung von $(1)$ is that of

\frac{σ^{2} U}{σ^{2} U + σ^{2} V} = \frac{U}{U + V}

$\frac{\sigma^2 U}{\sigma^2 U + \sigma^2 V} = \frac{U}{U+V}$

$U = X_1^2/\sigma^2 \sim \Gamma(1/2)$ $V = (X_2^2 + \cdots + X_n^2)/\sigma^2 \sim \Gamma((n-1)/2)$ are independent. It is well known that this ratio has a Beta $(1/2, (n-1)/2)$ distribution. (Also see the closely related thread at Distribution of $XY$ if $X \sim$ Beta $(1,K-1)$ and $Y \sim$ chi-squared with $2K$ degrees.)

Since

X_{1} + \dots + X_{n} = (1, 1, \dots, 1) \cdot (X_{1}, X_{2}, \dots, X_{n}) = \sqrt{n} e_{1} \cdot X

$X_1 + \cdots + X_n = (1,1,\ldots,1)\cdot (X_1, X_2, \cdots, X_n) = \sqrt{n}\,\mathbf{e}_1\cdot X$

for the unit vector $\mathbf{e}_1=(1,1,\ldots,1)/\sqrt{n}$ , we conclude that $Z$ is $(\sqrt{n})^2 = n$ times a Beta $(1/2, (n-1)/2)$ variate. For $n\ge 2$ it therefore has density function

f_{Z} (z) = \frac{n^{1 - n / 2}}{B (\frac{1}{2}, \frac{n - 1}{2})} \sqrt{\frac{(n - z)^{n - 3}}{z}}

$f_Z(z) = \frac{n^{1-n/2}}{B\left(\frac{1}{2}, \frac{n-1}{2}\right)} \sqrt{\frac{(n-z)^{n-3}}{z}}$

on the interval $(0,n)$ (and otherwise is zero).

As a check, I simulated $100,000$ independent realizations of $Z$ for $\sigma=1$ and $n=2,3,10$ , plotted their histograms, and superimposed the graph of the corresponding Beta density (in red). The agreements are excellent.

Here is the R code. It carries out the simulation by means of the formula sum(x)^2 / sum(x^2) for $Z$ , where x is a vector of length n generated by rnorm. The rest is just looping (for, apply) and plotting (hist, curve).

for (n in c(2, 3, 10)) {
  z <- apply(matrix(rnorm(n*1e5), nrow=n), 2, function(x) sum(x)^2 / sum(x^2))
  hist(z, freq=FALSE, breaks=seq(0, n, length.out=50), main=paste("n =", n), xlab="Z")
  curve(dbeta(x/n, 1/2, (n-1)/2)/n, add=TRUE, col="Red", lwd=2)
}

— whuber
quelle