Eine Normale geteilt durch


10

sei und .ZN(0,1)Wχ2(s)

Wenn und unabhängig voneinander verteilt sind, folgt die Variable einer Verteilung mit Freiheitsgraden .W Y = Z.ZW tsY=ZW/sts

Ich suche einen Beweis für diese Tatsache, eine Referenz ist gut genug, wenn Sie nicht das vollständige Argument aufschreiben möchten.


1
Dies wird formal unter stats.stackexchange.com/questions/52906 demonstriert : Das Verhältnis, wenn es als Integral geschrieben wird, wird als eine Mischung von Gaußschen angesehen, und diese Demonstration zeigt, dass sich die Mischung in der Verteilung befindet.
whuber

In einigen Lehrbüchern ist dies eine Definition einer T-Verteilung. Sie müssen es nicht beweisen. Wie man bei einer solchen Definition ein PDF ableitet, ist jedoch eine berechtigte Frage.
mpiktas

Antworten:


12

Sei eine Chi-Quadrat-Zufallsvariable mit Freiheitsgraden. Dann wird die Quadratwurzel von , als Chi-Verteilung mit Freiheitsgraden verteilt, die die Dichte n Y YnY n f Y ( y ) = 2 1 - nYY^n

(1)fY^(y^)=21n2Γ(n2)y^n1exp{y^22}

Definieren . Dann ist , und nach der Formel zur Änderung der Variablen haben wir das YX1nY^Y^X=n

fX(x)=fY^(nx)|Y^X|=21n2Γ(n2)(nx)n1exp{(nx)22}n

(2)=21n2Γ(n2)nn2xn1exp{n2x2}

Sei eine normale Standard-Zufallsvariable, unabhängig von den vorherigen, und definiere die ZufallsvariableZ

T=ZYn=ZX
.

Nach der Standardformel für die Dichtefunktion des Verhältnisses zweier unabhängiger Zufallsvariablen ist

fT(t)=|x|fZ(xt)fX(x)dx

Aber für das Intervall weil ein nicht negatives rv ist. Wir können also den Absolutwert eliminieren und das Integral auf reduzieren[ - , 0 ] X.fX(x)=0[,0]X

fT(t)=0xfZ(xt)fX(x)dx

=0x12πexp{(xt)22}21n2Γ(n2)nn2xn1exp{n2x2}dx

(3)=12π21n2Γ(n2)nn20xnexp{12(n+t2)x2}dx

Der Integrand in sieht vielversprechend aus, um schließlich in eine Gammadichtefunktion umgewandelt zu werden. Die Grenzen der Integration sind korrekt, daher müssen wir den Integranden so manipulieren, dass er zu einer Gammadichtefunktion wird, ohne die Grenzen zu ändern. Definieren Sie die Variable(3)

mx2dm=2xdxdx=dm2x,x=m12
Die Substitution in dem Integranden vornehmen, den wir haben

(4)I3=0xnexp{12(n+t2)m}dm2x=120mn12exp{12(n+t2)m}dm

Die Gammadichte kann geschrieben werden

Gamma(m;k,θ)=mk1exp{mθ}θkΓ(k)

Übereinstimmende Koeffizienten müssen wir haben

k1=n12k=n+12,1θ=12(n+t2)θ=2(n+t2)

Für diese Werte von und die Terme im Integranden, die die Variable betreffen, der Kern einer Gammadichte. Wenn wir also den Integranden durch dividieren und außerhalb des Integrals mit derselben Größe multiplizieren, ist das Integral das Gamma-Distr. Funktion und wird gleich Einheit. Deshalb sind wir angekommenθ * ( θ * ) , k * Γ ( k * )kθ(θ)kΓ(k)

I3=12(θ)kΓ(k)=12(2n+t2)n+12Γ(n+12)=2n12nn+12Γ(n+12)(1+t2n)12(n+1)

Einfügen des Obigen in Gl. wir bekommen(3)

fT(t)=12π21n2Γ(n2)nn22n12nn+12Γ(n+12)(1+t2n)12(n+1)

=Γ[(n+1)/2]nπΓ(n/2)(1+t2n)12(n+1)

... was als (Dichtefunktion) der t-Verteilung des Schülers mit Freiheitsgraden bezeichnet wird.n


23

Obwohl ES Pearson es nicht mochte, war Fischers ursprüngliches Argument geometrisch, einfach, überzeugend und streng. Es stützt sich auf eine kleine Anzahl intuitiver und leicht zu ermittelnder Fakten. Sie können leicht visualisiert werden, wenn oder , wobei die Geometrie in zwei oder drei Dimensionen visualisiert werden kann. Tatsächlich läuft es darauf hinaus, Zylinderkoordinaten in zu verwenden, um iid Normal-Variablen zu analysieren .s=1s=2Rs×Rs+1

  1. s+1 unabhängig und identisch verteilt Normalvariablen sind sphärisch symmetrisch. Dies bedeutet, dass die radiale Projektion des Punktes auf die Einheitskugel eine gleichmäßige Verteilung auf .X1,,Xs+1(X1,,Xs+1)SsRs+1 S sSs

  2. A Verteilung ist die die Summe der Quadrate der unabhängige Standardnormal variates.χ2(s)s

  3. Wenn also und , ist das Verhältnis die Tangente des Breitengrads des Punktes in .Z=Xs+1W=X12++Xs2Z/Wθ(X1,,Xs,Xs+1)Rs+1

  4. tanθ bleibt durch radiale Projektion auf unverändert .Ss

  5. Die Menge, die durch alle Breitengradpunkte auf ist eine dimensionale Kugel mit dem Radius . Sein Maß ist daher proportional zuθSss1cosθs1

    coss1θ=(1+tan2θ)(s1)/2.

  6. Das Differentialelement ist .d(tanθ)=cos2θdθ=(1+tan2θ)dθ

  7. Das Schreiben von ergibt , woraus und Zusammen implizieren diese GleichungenDas Einbeziehen des Faktors in eine Normalisierungskonstante zeigt, dass die Dichte von proportional zu istt=Z/W/s=stanθtanθ=t/s

    1+t2/s=1+tan2θ
    dt=sdtanθ=s(1+tan2θ)dθ.
    dθ=1s(1+t2/s)1dt.
    1/sC(s)t

    (1+tan2θ)(s1)/2dθ=(1+t2/s)(s1)/2 (1+t2/s)1dt=(1+t2/s)(s+1)/2dt.

Das ist die Student t-Dichte.

Zahl

Die Abbildung zeigt die obere Hemisphäre (mit ) von in . Die gekreuzten Achsen überspannen die Hyperfläche. Die schwarzen Punkte sind Teil einer Zufallsstichprobe einer Standardnormalverteilung mit Variablen: Sie sind die Werte, die auf einen konstanten gegebenen Breitengrad projizieren und als gelbes Band dargestellt sind. Die Dichte dieser Punkte ist proportional zum dimensionalen Volumen dieses Bandes, das selbst ein mit dem Radius . Der Kegel über diesem Band wird gezogen, um in einer Höhe von zu enden . Bis zu einem Faktor vonZ0SsRs+1Ws+1θs1Ss1θtanθsDie Student t-Verteilung mit Freiheitsgraden ist die Verteilung dieser Höhe, gewichtet mit dem Maß des gelben Bandes bei Normalisierung der Fläche der Einheitskugel auf Eins.sSs

Im Übrigen muss die Normalisierungskonstante das (wie zuvor erwähnt) mal das relative Volumen der Kugeln betragen .1/s

C(s)=1s|Ss1||Ss|=1ssπs/2Γ(s+12+1)(s+1)π(s+1)/2Γ(s2+1)=1ssπs/2(s+1)/2Γ(s+12)(s+1)π(s+1)/2(s/2)Γ(s2)=Γ(s+12)sπΓ(s2).

Der endgültige Ausdruck, obwohl konventionell, verschleiert leicht den schön einfachen Anfangsausdruck, der die Bedeutung von klar offenbart .C(s)


Fisher erklärte diese Ableitung WS Gosset (dem ursprünglichen "Studenten") in einem Brief. Gosset versuchte es zu veröffentlichen und gab Fisher die volle Anerkennung, aber Pearson lehnte das Papier ab. Die Fisher-Methode, die auf das im Wesentlichen ähnliche, aber schwierigere Problem angewendet wurde, die Verteilung eines Probenkorrelationskoeffizienten zu finden, wurde schließlich veröffentlicht.

Verweise

RA Fisher, Häufigkeitsverteilung der Werte des Korrelationskoeffizienten in Proben einer unendlich großen Population. Biometrika Vol. 10, Nr. 4 (Mai 1915), S. 507-521. Verfügbar im Internet unter https://stat.duke.edu/courses/Spring05/sta215/lec/Fish1915.pdf (und an vielen anderen Stellen über die Suche, sobald dieser Link verschwindet).

Joan Fisher Box, Gosset, Fisher und die t Distribution. Der amerikanische Statistiker , Vol. 35, Nr. 2 (Mai 1981), S. 61-66. Verfügbar im Internet unter http://social.rollins.edu/wpsites/bio342spr13/files/2015/03/Studentttest.pdf .

EL Lehmann, Fisher, Neyman und die Erstellung klassischer Statistiken. Springer (2011), Kapitel 2.


Das ist ein fantastischer Beweis! Ich hoffe aufrichtig, dass Sie diese Nachricht finden, obwohl es nun einige Jahre her ist. Im sechsten Schritt dieses Beweises glaube ich, dass es einen Fehler gibt. Cos ^ -2 (Theta) = (1 + tan ^ 2 (Theta)), nicht seine Umkehrung. Betet, dass es eine einfache Lösung gibt?
Math Enthusiast

@ Math Vielen Dank für Ihre Bemerkungen. In Schritt 6 finde ich keinen Fehler. Vielleicht versuchen Sie, " " (was die Potenz von ) so zu lesen, als ob es " "? - 2cos2(θ)2( ArcCos ( θ ) ) 2cos(θ)(ArcCos(θ))2
whuber

1
Ich habe die einfache Identität um daraus zu schließen, dass in Zeile 5 Aber nach derselben Überlegung in Zeile 6 ist . Dies steht im Widerspruch zu der Behauptung, dass das Differentialelement gleichc o s θ = ( t ein n 2 θ + 1 ) - 1 / 2 c O s - 2 ) - 1sec2θ=tan2θ+1cosθ=(tan2θ+1)1/2cos2θ=sec2θ=(tan2θ+1)(tan2θ+1)1
Math Enthusiast

@ Math Danke - du hast natürlich Recht. Ich habe die Punkte (6) und (7) bearbeitet, um die Algebra zu korrigieren.
whuber

1
Puh, was für eine Erleichterung! Frohe Feiertage zu Ihnen
Math Enthusiast

1

Ich würde versuchen, Variablen zu ändern. Set und zum Beispiel. Also ist , . Dann ist. Wobei die Jacobi-Matrix für die multivariate Funktion von und von und . Dann können Sie aus der Fugendichte integrieren. , , undY=ZWsX=ZZ=XW=sX2Y2fX,Y(x,y)=fZ,W(x,sx2y2)|det(J)|JZWXYxZX=1ZY=0W.WX=2sXY2WY=2sX2Y3 .

J=(102sX2Y3)

Also . Ich habe gerade einen Blick auf Elemente der Verteilungstheorie von Thomas A. Severini und dort, sie nehmen . Das Integrieren von Dingen wird mithilfe der Eigenschaften einer Gaama-Verteilung einfacher. Wenn ich , müsste ich wahrscheinlich Quadrate vervollständigen. X=WX=Z.|det(J)|=2sx2y3X=WX=Z

Aber ich möchte die Berechnung nicht durchführen.


1
Ich habe dich nicht herabgestimmt, sondern nur hochgestimmt. Aber ich denke, vielleicht ist die Ablehnung vor Ihrer Bearbeitung eingetroffen.
Monolite

Tut mir leid, ich werde von nun an vorsichtig sein.
Ztyh
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.