Was ist die Summe der quadrierten t-Variablen?


20

Es sei aus einer Student-t-Verteilung mit Freiheitsgraden für mäßig große (sagen wir weniger als 100) gezogen. Definiere Ist fast wie ein Chi-Quadrat mit Freiheitsgraden verteilt? Gibt es so etwas wie den zentralen Grenzwertsatz für die Summe der quadratischen Zufallsvariablen?tinn

T=1ikti2
Tk

@suncoolsu: es sagt "fast" ...
shabbychef

Entschuldigen Sie. habe das nicht gesehen.
Suncoolsu

Antworten:


14

Beantwortung der ersten Frage.

Wir könnten von der von mpiktas festgestellten Tatsache ausgehen, dass . Versuchen Sie zunächst einen einfacheren Schritt: Suchen Sie nach der Verteilung einer Summe von zwei durch verteilten Zufallsvariablen . Dies könnte entweder durch Berechnung der Faltung zweier Zufallsvariablen oder durch Berechnung des Produkts ihrer charakteristischen Funktionen geschehen.t2F(1,n)F(1,n)

Der Artikel von PCB Phillips zeigt, dass meine erste Vermutung über "[konfluente] hypergeometrische Funktionen" in der Tat richtig war. Dies bedeutet, dass die Lösung nicht trivial ist und die Brute-Force-Methode kompliziert, aber zur Beantwortung Ihrer Frage erforderlich ist. Da also fest ist und Sie t-Verteilungen zusammenfassen, können wir nicht sicher sagen, wie das Endergebnis aussehen wird. Es sei denn, jemand hat gute Kenntnisse im Umgang mit Produkten konfluenter hypergeometrischer Funktionen.n


2
+1 für den Link, wusste nicht, dass die charakteristische Funktion der F-Verteilung so kompliziert war.
mpiktas

14

Es ist nicht einmal eine enge Annäherung. Für kleines ist die Erwartung von T gleich k nnT während die Erwartung vonχ2(k)gleichk ist. Wennkklein ist (sagen wir weniger als 10), haben die Histogramme vonlog(T)undlog(χ2(k))nicht einmal die gleiche Form, was darauf hinweist, dass das Verschieben und Neuskalieren vonTimmer noch nicht funktioniert.knn2χ2(k)kklog(T)log(χ2(k))T

Intuitiv für kleine Freiheitsgrade Student ist schwer tailed. Das Quadrieren betont diese Schwere. Die Summen , daher werden mehr schief - in der Regel viel mehr schief - als Summe der quadratischen Normalen (die χ 2 Verteilung). Berechnungen und Simulationen belegen dies.tχ2


Illustration (wie gewünscht)

Alt-Text

Jedes Histogramm zeigt eine unabhängige Simulation von 100.000 Versuchen mit den angegebenen Freiheitsgraden ( ) und Summanden ( k ), standardisiert wie von @mpiktas beschrieben. Der Wert von n = 9999 in der unteren Reihe entspricht in etwa dem Fall χ 2 . Sie können also T mit χ 2 vergleichen , indem Sie jede Spalte abtasten.nkn=9999χ2Tχ2

Beachten Sie, dass eine Standardisierung für nicht möglich ist, da die entsprechenden Momente nicht einmal existieren. Der Mangel an Formstabilität (beim Scannen von links nach rechts über eine Zeile oder von oben nach unten über eine Spalte) ist für n 4 noch deutlicher .n<5n4


Ich hatte Angst davor, aber ich dachte, dass das Summieren die Schwänze etwas einbringen würde.
Shabbychef

Ich habe auch überlegt, eine Art von Monte-Carlo-Experimenten zu erstellen, um herauszufinden, für welches und k die Näherung nahe genug bei χ 2 ( k ) liegen könnte , wahrscheinlich bei k ( n ) , die wir hier benötigen. Aber für kleine k und besonders n wird es in der Tat sehr schwer sein. Könnten Sie vielleicht diese beiden Histogramme hier einfügen, nur für faule Leute wie mich? nkχ2(k)k(n)kn
Dmitrij Celov

@Dmitrij Die Simulationen sind schnell (das Zeichnen der Histogramme nimmt mehr Zeit in Anspruch), daher habe ich 12 davon hinzugefügt.
whuber

+1 für die Figur. Abbildungen sind immer schön anzusehen.
Dmitrij Celov

7

k

TkE(t1)2kVar(t12)N(0,1)

woher Et12Var(t12)nt121n

Tknn2k2n2(n1)(n2)2(n4)N(0,1)


1
Hotellings T ^ 2: (f - d + 1) / fd T ^ 2 ∼ F (d, f + 1 - d)
DWin

1
T2TT2

F(1,n)+F(1,n)

Ich glaube, es reduziert sich auf Ihre Situation, wenn die Varianzmatrix diagonal ist. Die nicht diagonalen Elemente einer Stichprobe sollten nahe Null sein, wenn die Stichproben von Normal stammen, aber möglicherweise nicht genau Null, wenn sie von t stammen. Trotzdem haben Sie nach einem ungefähren Wert gefragt, daher denke ich, dass die Antwort unter diesem Vorbehalt wahrscheinlich F lautet.
DWin

F(1,n)F
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.