t-Verteilung mit schwererem Schwanz als Normalverteilung


10

In meinen Vorlesungsunterlagen heißt es:

Die T-Verteilung sieht normal aus, allerdings mit etwas schwereren Schwänzen.

Ich verstehe, warum es normal aussehen würde (aufgrund des zentralen Grenzwertsatzes). Es fällt mir jedoch schwer zu verstehen, wie ich mathematisch beweisen kann, dass es schwerere Schwänze als die Normalverteilung hat und ob es eine Möglichkeit gibt, zu messen, inwieweit es schwerer als die Normalverteilung ist.

Antworten:


12

Das erste, was zu tun ist, ist zu formalisieren, was wir unter "schwererem Schwanz" verstehen. Man könnte sich fiktiv ansehen, wie hoch die Dichte im extremen Schwanz ist, nachdem beide Verteilungen so standardisiert wurden, dass sie dieselbe Position und denselben Maßstab haben (z. B. Standardabweichung):

Geben Sie hier die Bildbeschreibung ein
(aus dieser Antwort, die auch für Ihre Frage etwas relevant ist )

[In diesem Fall spielt die Skalierung am Ende keine Rolle. Das t ist immer noch "schwerer" als das normale, selbst wenn Sie sehr unterschiedliche Skalen verwenden. das normale geht irgendwann immer niedriger]

Diese Definition verallgemeinert sich jedoch nicht sehr gut, obwohl sie für diesen speziellen Vergleich in Ordnung ist.

Ganz allgemein ist die Antwort von whuber hier viel besser definiert . Wenn also schwerer als , da ausreichend groß wird (für alle einige ), dann ist , wobei , wobei das cdf ist (für schwerer) -schwanz auf der rechten Seite; es gibt eine ähnliche, offensichtliche Definition auf der anderen Seite).YXtt>t0SY(t)>SX(t)S=1FF

Geben Sie hier die Bildbeschreibung ein

Hier ist es auf der logarithmischen Skala und auf der Quantilskala der Normalen, was uns erlaubt, mehr Details zu sehen:

Geben Sie hier die Bildbeschreibung ein

Der "Beweis" für eine stärkere Schwanzigkeit würde also den Vergleich von cdfs beinhalten und zeigen, dass der obere Schwanz des t-cdf schließlich immer über dem des Normalen und der untere Schwanz des t-cdf schließlich immer unter dem des Normalen liegt.

In diesem Fall ist es einfach, die Dichten zu vergleichen und dann zu zeigen, dass sich daraus die entsprechende relative Position der cdfs (/ Survivor-Funktionen) ergeben muss.

Also zum Beispiel, wenn Sie das argumentieren können (bei einem bestimmten )ν

x2(ν+1)log(1+x2ν)>2log(k)

für die notwendige Konstante (eine Funktion von ), für alle einige , wäre es möglich, einen schwereren Schwanz für auch für die Definition in Bezug auf größeres (oder größeres on) festzulegen der linke Schwanz).kνx>x0tν1FF

(diese Form ergibt sich aus der Differenz des Logarithmus der Dichten, wenn dies die notwendige Beziehung zwischen den Dichten enthält)

[Es ist tatsächlich möglich, es für jedes zu zeigen (nicht nur für dasjenige, das wir aus den relevanten Dichtennormalisierungskonstanten benötigen), daher muss das Ergebnis für das wir benötigen.]kk


1
Ein Graph mit (und vielleicht ein wenig ) könnte die schwereren Schwänze deutlicher zeigen und könnte auch mit höheren Freiheitsgraden arbeitenlogS(x)x
Henry

1
@ Henry Ich habe ein solches Diagramm erstellt, war mir aber nicht sicher, wie viel Wert es hinzugefügt hat, also habe ich es nicht aufgenommen. Ich werde darüber nachdenken, es
einzubauen

1
@ Henry Ich habe die Handlung aufgenommen.
Glen_b -Reinstate Monica

2

Eine Möglichkeit, den Unterschied zu erkennen, ist die Verwendung der MomenteE{xn}.

"Schwerere" Schwänze bedeuten höhere Werte für die gleichmäßigen Leistungsmomente (Leistung 4, 6, 8), wenn die Varianz gleich ist. Insbesondere wird das Moment 4. Ordnung (um Null) als Kurtosis bezeichnet und vergleicht in gewissem Sinne die Schwere der Schwänze.

Siehe Wikipedia für Details ( https://en.wikipedia.org/wiki/Kurtosis )


1
Obwohl für eine Verteilung mit oder Freiheitsgraden die Kurtosis unendlich ist, während bei Freiheitsgraden die Standardabweichung unendlich ist, so dass Sie die Kurtosis nicht berechnen können, und mit Freiheitsgrad können Sie nicht einmal den Mittelwert oder berechnen der Moment. t34214
Henry

3
@ Henry Trotzdem ist diese Idee gut. Das Erweitern der CDF der Student -Verteilung um zeigt, dass sie asymptotisch proportional zu . Somit existieren alle absoluten Gewichtsmomente kleiner als und alle absoluten Gewichtsmomente größer als divergieren. Bei der Normalverteilung existieren alle absoluten Momente. Dies liefert eine eindeutige Reihenfolge der Schwänze aller Student- Verteilungen und der Normalverteilung. liefert der Parameter eine Antwort auf die ursprüngliche Frage, wie die Schwere eines Schwanzes gemessen werden soll. t(ν)+xνννtν
whuber

2

Hier ist ein formaler Beweis, der auf den Überlebensfunktionen basiert. Ich verwende die folgende Definition von "schwerer Schwanz", inspiriert von Wikipedia :

Eine Zufallsvariable mit der Überlebensfunktion hat schwerere Schwänze als eine Zufallsvariable mit der Überlebensfunktion iff YSy(t)XSx(t)

limtSy(t)Sx(t)=

Betrachten Sie eine Zufallsvariable die als Student's t mit dem Mittelwert Null, den Freiheitsgraden und dem Skalenparameter . Wir vergleichen dies mit der Zufallsvariablen . Für beide Variablen sind die Überlebensfunktionen differenzierbar. Deshalb, YνaXN(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
Wo wir . Beachten Sie, dass eine Konstante ist, und Nach dem algebraischen Grenzwertsatz ist u=t2/a20<a2/σ2<limuC/u=0
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

Wichtig ist, dass das Ergebnis für beliebige (endliche) Werte von , und , sodass Sie Situationen haben können, in denen die Verteilung eine geringere Varianz als normal aufweist, aber immer noch schwerere Schwänze aufweist.aσ2ν


1
Nur eine Anmerkung, dass diese "Definition" von schwereren Schwänzen nicht immer akzeptabel ist. Zum Beispiel hat die N (0,1) -Verteilung nach dieser Definition schwerere Schwänze als die .9999 * U (-1,1) + .0001 * U (-1000, 1000) -Verteilung, obwohl die letztere Verteilung erzeugt gelegentliche Werte bis zu 175 Standardabweichungen vom Mittelwert, obwohl die Unterstützung begrenzt ist. Natürlich erzeugt das N (0,1) auch solche Werte, aber mit Wahrscheinlichkeiten, die weit unter denen liegen, die für praktische Zwecke als relevant angesehen werden können.
Peter Westfall
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.