Welches hat den schwereren Schwanz, lognormal oder gamma?


41

(Dies basiert auf einer Frage, die ich gerade per E-Mail erhalten habe. Ich habe einen Kontext aus einem vorherigen kurzen Gespräch mit derselben Person hinzugefügt.)

Letztes Jahr wurde mir gesagt, dass die Gammaverteilung schwerer ist als die logarithmische Verteilung, und seitdem wurde mir mitgeteilt, dass dies nicht der Fall ist.

  • Welches ist schwerer Schwanz?

  • Mit welchen Ressourcen kann ich die Beziehung untersuchen?


3
An die Person, die gerade eine Ablehnung vorgenommen hat: Es wäre nützlich zu wissen, was das wahrgenommene Problem mit der Frage ist.
Glen_b

1
War ich nicht, habe ich mich vor langer Zeit empört. Ich vermute jedoch, dass es um die Nützlichkeit von Schwerfälligkeit gegenüber Kurtosis im Kontext von T-Test-Annahmen in Gegenwart von Ausreißern ging, was absolut nichts mit dem zu tun hat, was Sie gefragt haben. Downvoting ist meiner Meinung nach problematisch .
Carl

Antworten:


41

Das (rechte) Ende einer Distribution beschreibt ihr Verhalten bei großen Werten. Das richtige Objekt zu studieren ist nicht seine Dichte - was in vielen praktischen Fällen gibt es nicht - sondern seine Verteilungsfunktion . Insbesondere, weil für große Argumente (nach dem Gesetz der Gesamtwahrscheinlichkeit) asymptotisch auf steigen muss , interessiert uns, wie schnell es sich dieser Asymptote nähert: Wir müssen das Verhalten seiner Überlebensfunktion als .FF11 - F ( x ) x x 1F(x)x

Genauer gesagt, eine Verteilung für eine Zufallsvariable ist „schwerer“ als ein anderen vorgesehen , daß schließlich mehr Wahrscheinlichkeit bei großen Werten als dies . Dies kann formalisiert werden: Es muss eine endliche Anzahl existieren so dass für alle ,FXG FGx0x>x0

PrF(X>x)=1F(x)>1G(x)=PrG(X>x).

Zahl

Die rote Kurve in dieser Abbildung ist die Überlebensfunktion für eine Poisson -Verteilung. Die blaue Kurve gilt für eine Gamma -Verteilung, die dieselbe Varianz aufweist. Schließlich übersteigt die blaue Kurve immer die rote Kurve, was zeigt, dass diese Gamma-Verteilung einen schwereren Schwanz als diese Poisson-Verteilung hat. Diese Verteilungen können unter Verwendung von Dichten nicht ohne weiteres verglichen werden, da die Poisson-Verteilung keine Dichte aufweist.(3)(3)

Es ist wahr , dass , wenn die Dichte und exist und für dann ist schwerer als Schwanz . Die Umkehrung ist jedoch falsch - und dies ist ein zwingender Grund, die Definition der Schwanzschwere eher auf Überlebensfunktionen als auf Dichten zu stützen, selbst wenn die Analyse der Schwänze häufig einfacher unter Verwendung der Dichten durchgeführt werden kann.fgf(x)>g(x)x>x0FG

Gegenbeispiele können konstruiert werden, indem eine diskrete Verteilung von positivem, unbegrenztem Support verwendet wird, die dennoch nicht schwerer als (Diskretisierung von wird den Trick tun). Verwandeln Sie dies in eine stetige Verteilung, indem Sie die Wahrscheinlichkeitsmasse von an jedem ihrer Stützpunkte , geschrieben , durch eine skalierte Beta -Verteilung mit Stützung in einem geeigneten Intervall und gewichtet mit . Mit einer kleinen positiven Zahl wählen SieHGGHkh(k)(2,2)[kε(k),k+ε(k)]h(k)δ,ε(k)ausreichend klein, um sicherzustellen, dass die Peakdichte dieser skalierten Beta-Verteilung überschreitet . Durch die Konstruktion, die Mischung ist eine kontinuierliche Verteilung dessen Schwanzes Aussehen wie die von (es ist gleichförmig ein klein wenig um einen Betrag senken ), hat aber in seinen spikes Dichte am Träger von und all diese Spitzen haben Punkte, an denen sie die Dichte von überschreiten . Somit ist heller als aber egal wie weit draußen wir im Schwanz sind, es wird Punkte geben, an denen seine Dichte die von übersteigt .f(k)/δδH+(1δ)GGGδHfGFF

Zahl

Die rote Kurve ist das PDF einer Gamma-Verteilung , die goldene Kurve ist das PDF einer logarithmischen Normalverteilung und die blaue Kurve (mit Spitzen) ist das PDF einer Mischung die wie im Gegenbeispiel konstruiert wurde. (Beachten Sie die logarithmische Dichteachse.) Die Überlebensfunktion von in etwa der einer Gamma-Verteilung (mit schnell abklingenden Wackelbewegungen): Sie wird schließlich kleiner als die von , obwohl die PDF-Datei immer darüber hinausgeht von egal wie weit wir in die Schwänze schauen.GFGGFF


Diskussion

Übrigens können wir diese Analyse direkt für die Überlebensfunktionen von lognormalen und Gamma-Verteilungen durchführen, indem wir sie um , um ihr asymptotisches Verhalten zu ermitteln, und daraus schließen, dass alle Lognormale einen schwereren Schwanz haben als alle Gamma-Verteilungen . Da diese Verteilungen jedoch "schöne" Dichten aufweisen, kann die Analyse einfacher durchgeführt werden, indem gezeigt wird, dass für ausreichend großes eine lognormale Dichte eine Gammadichte überschreitet. Verwechseln wir diese analytische Annehmlichkeit jedoch nicht mit der Bedeutung eines schweren Schwanzes.x=x

Auch wenn höhere Momente und ihre Varianten (wie Schiefe und Kurtosis) ein wenig über die Schwänze aussagen, liefern sie keine ausreichenden Informationen. Als einfaches Beispiel können wir jede logarithmische Normalverteilung auf einen so großen Wert abschneiden, dass sich eine bestimmte Anzahl ihrer Momente kaum ändert. Dabei haben wir jedoch ihren Schwanz vollständig entfernt, sodass sie leichter ist als jede Verteilung mit unbegrenzten Grenzen Unterstützung (wie ein Gamma).

Ein fairer Einwand gegen diese mathematischen Verzerrungen wäre, darauf hinzuweisen, dass das Verhalten, das sich so weit im Verborgenen befindet, keine praktische Anwendung hat, weil niemand jemals glauben würde, dass ein Verteilungsmodell bei solch extremen (vielleicht physikalisch unerreichbaren) Werten gültig sein wird. Dies zeigt jedoch, dass wir bei Anwendungen vorsichtig sein müssen, um festzustellen, welcher Teil des Schwanzes von Belang ist, und ihn entsprechend zu analysieren. (In diesem Sinne können beispielsweise Hochwasserrücklaufzeiten verstanden werden: 10-Jahres-Hochwasser, 100-Jahres-Hochwasser und 1000-Jahres-Hochwasser kennzeichnen bestimmte Abschnitte des Endes der Hochwasserverteilung.) Es gelten jedoch die gleichen Prinzipien: Grundlegender Gegenstand der Analyse ist hier die Verteilungsfunktion und nicht ihre Dichte.


6
+1 ausgezeichnete Diskussion darüber, warum es auf der Überlebensfunktion basieren sollte. Ich habe der ursprünglichen Quelle der Frage empfohlen, dass sie sich Ihre Antwort ansehen sollten.
Glen_b

1
(+1) für eine gute probabilistische Diskussion der Interpretation der Überlebensfunktion.

Diese Definition von schweren Schwänzen ist als eine Definition in Ordnung . Aber es hat ernsthafte Probleme. Insbesondere gibt es begrenzte Verteilungen, die möglicherweise schwere Schwänze aufweisen, wie z. B. eine Verteilung von 0,9999 * U (-1,1) + 0,0001 * U (-1000,1000). Nach der gegebenen "Definition" hat die N (0,1) -Verteilung schwerere Schwänze als die .9999 * U (-1,1) + .0001 * U (-1000,1000) -Verteilung. Das ist offensichtlich albern. Seien wir ehrlich: Es gibt unendlich viele Möglichkeiten, die Verteilungsschwäche zu messen.
Peter Westfall

1
@Peter Die "Albernheit" entsteht, weil Sie die Ideen rückwärts bekommen zu haben scheinen. Keines Ihrer Beispiele hat in irgendeiner Weise einen "schweren" Schwanz, weil sie begrenzt sind. Beide Überlebensfunktionen sind schließlich genau Null und daher sind beide Schwänze gleich leicht.
Whuber

1
@PeterWestfall Sie haben Schwänze mit eingeschränkter Unterstützung mit Schwänzen mit unendlicher Unterstützung verglichen, als ob dies sinnvoll wäre. Es gibt viele Kontexte, in denen das unnötig und sogar albern wäre. In solchen Zusammenhängen, in denen man sie vergleichen würde, kann ein Quantildifferenzverhältnis angemessen sein. Es gibt nicht viele Kontexte darüber hinaus, und wenn Sie sich einen vorstellen können, sagen Sie es.
Carl

30

Sowohl das Gamma als auch das Lognormal sind rechtwinklige, konstante Variationskoeffizientenverteilungen auf , und sie sind häufig die Grundlage für "konkurrierende" Modelle für bestimmte Arten von Phänomenen.(0,)

Es gibt verschiedene Möglichkeiten, die Schwere eines Schwanzes zu definieren, aber in diesem Fall zeigen meines Erachtens alle üblichen, dass das lognormal schwerer ist. (Worüber die erste Person vielleicht gesprochen hat, ist das, was nicht im hinteren Teil, sondern ein wenig rechts vom Modus abläuft (etwa um das 75. Perzentil in der ersten Darstellung unten, die für das Lognormal knapp unter 5 liegt) und das Gamma knapp über 5.)

Lassen Sie uns die Frage jedoch zunächst auf sehr einfache Weise untersuchen.

Unten sind Gamma- und Lognormal-Dichten mit Mittelwert 4 und Varianz 4 (oberes Diagramm - Gamma ist dunkelgrün, Lognormal ist blau) und dann das Log der Dichte (unten) aufgeführt, damit Sie die Trends in den Schwänzen vergleichen können:

Bildbeschreibung hier eingeben

In der oberen Darstellung sind kaum Details zu erkennen, da sich die gesamte Aktion rechts von 10 befindet. In der zweiten Darstellung ist es jedoch ziemlich klar, dass das Gamma viel schneller nach unten geht als das logarithmische Normal.

Eine andere Möglichkeit, die Beziehung zu untersuchen, besteht darin, die Dichte der Protokolle wie in der Antwort hier zu betrachten . Wir sehen, dass die Dichte der Logs für das Lognormal symmetrisch ist (es ist normal!), und dass für das Gamma der linke Versatz mit einem leichten Schwanz rechts ist.

Wir können es algebraisch machen, wobei wir das Verhältnis der Dichten als (oder das Protokoll des Verhältnisses) betrachten können. Sei eine Gammadichte und lognormal:xgf

log(g(x)/f(x))=log(g(x))log(f(x))

=log(1Γ(α)βαxα1ex/β)log(12πσxe(log(x)μ)22σ2)

=k1(α1)log(x)x/β(k2log(x)(log(x)μ)22σ2)

=[c(α2)log(x)+(log(x)μ)22σ2]x/β

Der Term in [] ist ein Quadrat in , während der verbleibende Term in linear abnimmt . Egal, was , dass irgendwann schneller sinkt als der quadratische Anstieg, unabhängig von den Parameterwerten . In der Grenze als nimmt der logarithmische Wert des Dichtenverhältnisses in Richtung , was bedeutet, dass das Gamma-PDF letztendlich viel kleiner als das logarithmische PDF ist und relativ weiter abnimmt. Wenn Sie das Verhältnis in die andere Richtung nehmen (mit lognormal oben), muss es eventuell über alle Grenzen hinaus ansteigen.log(x)xx/βx

Das heißt, jedes gegebene Lognormal ist schließlich schwerer als irgendein Gamma.


Andere Definitionen der Schwere:

Manche Menschen interessieren sich für Schiefe oder Kurtosis, um die Schwere des rechten Schwanzes zu messen. Bei einem gegebenen Variationskoeffizienten ist der logarithmische Normalwert sowohl schiefer als auch kurtotischer als der gamma- Wert . **

Beispiel: Bei einer Schiefe hat das Gamma eine Schiefe von 2CV, während die logarithmische Norm 3CV + CV beträgt .3

Es gibt einige technische Definitionen für verschiedene Maße, wie schwer die Schwänze hier sind . Vielleicht möchten Sie einige dieser Distributionen ausprobieren. Das Lognormal ist ein interessanter Sonderfall in der ersten Definition - alle seine Momente existieren, aber seine MGF konvergieren nicht über 0, während die MGF für das Gamma in einer Nachbarschaft um Null konvergieren.

-

** Wie Nick Cox weiter unten erwähnt, ist die übliche Transformation zur Annäherung an die Normalität für das Gamma, die Wilson-Hilferty-Transformation, schwächer als das Protokoll - es ist eine Kubikwurzeltransformation. Bei kleinen Werten des Formparameters wurde stattdessen die vierte Wurzel erwähnt, siehe die Diskussion in dieser Antwort , aber in beiden Fällen ist es eine schwächere Transformation, um eine Nahezu-Normalität zu erreichen.

Der Vergleich der Schiefe (oder Kurtosis) deutet nicht auf eine notwendige Beziehung im Extremschwanz hin, sondern sagt etwas über das durchschnittliche Verhalten aus. aber es kann aus diesem Grund besser funktionieren, wenn der ursprüngliche Punkt nicht über den extremen Schwanz gemacht wurde.


Ressourcen : Es ist einfach, Programme wie R oder Minitab oder Matlab oder Excel zu verwenden, oder was auch immer Sie möchten, um Dichten und Log-Dichten und Log-Verhältnisse von Dichten zu zeichnen ... und so weiter, um zu sehen, wie die Dinge in bestimmten Fällen ablaufen. Das würde ich vorschlagen, um damit zu beginnen.


4
In der Tat deutet dies darauf hin, aber es gibt keine notwendige Beziehung zwischen Peakedness, Heavy-Tailedness und Kurtosis. Es gibt Gegenbeispiele zu solchen Erwartungen, also müssen wir aufpassen. Die zweite Handlung bestätigt jedoch den Verdacht.
Glen_b

5
Hier ist ein Einzeiler. Es ist eine Definition, dass eine Protokolltransformation erforderlich ist, um ein normales Protokoll zu erstellen. Es ist eine gute Annäherung, dass eine Kubikwurzel ein Gamma normalisiert (Wilson-Hilferty sind zwei Wörter für die Weisen). Die Verteilung, für die eine stärkere Transformation erforderlich ist, ist "weiter" vom Normalen oder Gaußschen.
Nick Cox

2
@ Glen_b Ich füge gerade einer sehr gut aussehenden Torte von Ihnen eine kleine Dekoration hinzu.
Nick Cox

2
@ Nick Cox Ich bin mit den Aussagen über Transformationen nicht einverstanden. Der mathematisch unzulässige Teil ist die Schlussfolgerung, die Sie zu ziehen versuchen: Aus der Tatsache, dass ein Logarithmus das Lognormal normalisiert und eine Kubikwurzel ein Gamma annähernd normalisiert, können Sie keine Schlussfolgerung über die Schwänze beider ziehen.
whuber

2
Vielen Dank; Ihr Punkt ist mir klarer, aber ich halte mich an meine Faustregel und rufe auch Erfahrung hervor. Klar, ich habe keinen Satz.
Nick Cox

7

Obwohl Kurtosis mit der Schwere von Schwänzen zusammenhängt, würde sie mehr zur Vorstellung von Fettschwanzverteilungen beitragen und verhältnismäßig weniger zur Schwere von Schwänzen selbst, wie das folgende Beispiel zeigt. Hier spucke ich jetzt aus, was ich oben und unten in den Posts gelernt habe. Das sind wirklich exzellente Kommentare. Erstens ist die Fläche eines rechten Schwanzes die Fläche von x bis einer -Dichtefunktion, AKA die Überlebensfunktion . Für die logarithmische Normalverteilung und die Gamma-Verteilungf(x)1F(t)e(log(x)μ)22σ22πσx;x0βαxα1eβxΓ(α);x0Vergleichen wir ihre jeweiligen Überlebensfunktionen und grafisch. Dazu setze ich willkürlich die jeweiligen Varianzen und , sowie ihre jeweiligen überschüssigen Kurtosen und gleich mit und gelöst nach . Das zeigt12erfc(log(x)μ2σ)Q(α,βx)=Γ(α,βx)Γ(α)(eσ21)e2μ+σ2αβ23e2σ2+2e3σ2+e4σ266αμ=0,σ=0.8α0.19128,β0.3354211-F (x) für LND in Blau und GD in Orange

die Überlebensfunktion für die Lognormalverteilung (LND) in blau und die Gammaverteilung (GD) in orange. Dies bringt uns zu unserer ersten Vorsicht. Das heißt, wenn diese Handlung alles wäre, was wir untersuchen würden, könnten wir den Schluss ziehen, dass der Schwanz für GD schwerer ist als für LND. Dass dies nicht der Fall ist, wird durch Erweitern der x-Achsen-Werte des Diagramms gezeigt 1-F (x) für LND und GD längeres Diagramm

Diese Darstellung zeigt, dass 1) sich die rechten Schwanzbereiche von LND und GD auch bei gleichen Kurtosen unterscheiden können. 2) Allein diese grafische Interpretation birgt Gefahren, da Ergebnisse für feste Parameterwerte nur in einem begrenzten Bereich angezeigt werden können. Es besteht daher ein Bedarf, allgemeine Ausdrücke für das Verhältnis der begrenzenden Überlebensfunktionen von . Mit unendlichen Serienerweiterungen konnte ich das nicht machen. Ich war jedoch in der Lage, dies zu tun, indem ich die Vermittlung von terminalen oder asymptotischen Funktionen verwendete, die keine eindeutigen Funktionen sind und bei denen für die Schwänze der rechten Hand dann ist ausreichend für undlimxS(LND,x)S(GD,x)limxF(x)G(x)=1F(x)G(x)gegenseitig asymptotisch sein. Mit der gebotenen Sorgfalt beim Auffinden dieser Funktionen kann eine Untergruppe von einfacheren Funktionen als die Überlebensfunktionen selbst identifiziert werden, die mit mehr als einer Dichtefunktion gemeinsam oder gemeinsam genutzt werden können, beispielsweise können zwei verschiedene Dichtefunktionen gemeinsam genutzt werden ein begrenzender exponentieller Schwanz. In der vorherigen Version dieses Beitrags wurde dies als "zusätzliche Komplexität beim Vergleichen von Überlebensfunktionen" bezeichnet. Beachten Sie, dass und (im Übrigen und nicht unbedingt undlimuerfc(u)eu2πu=1limuΓ(α,u)euuα1=1erfc(u)<eu2πuΓ(α,u)<euuα1 . Das heißt, es ist nicht erforderlich, eine Obergrenze zu wählen, sondern nur eine asymptotische Funktion. Hier schreiben wir und wobei das Verhältnis der Begriffe der rechten Hand die gleiche Grenze wie als die linke Hand Begriffe. Vereinfachung des Grenzverhältnisses von Termen der rechten Hand ergibt12erfc(log(x)μ2σ)<e(log(x)μ2σ)22(π(log(x)μ))2σΓ(α,βx)Γ(α)<eβx(βx)α1Γ(α)xlimxσΓ(α)(βx)1αeβx(μlog(x))22σ22π(log(x)μ)= bedeutet, dass für x ausreichend groß die LND-Schwanzfläche ist im Vergleich zum GD-Heckbereich beliebig groß, unabhängig von den Parameterwerten. Dies wirft ein weiteres Problem auf. Wir haben nicht immer Lösungen, die für alle Parameterwerte zutreffen. Daher kann es irreführend sein, nur grafische Darstellungen zu verwenden. Beispielsweise ist der rechte Endbereich der Gammaverteilung größer als der Endbereich der Exponentialverteilung, wenn , kleiner als der Exponentialbereich, wenn und die GD ist genau eine Exponentialverteilung, wenn .α<1α>1α=1

Was nützt es dann, die Logarithmen des Verhältnisses der Überlebensfunktionen zu nehmen, da wir offensichtlich keine Logarithmen benötigen, um ein begrenzendes Verhältnis zu finden? Viele Verteilungsfunktionen enthalten exponentielle Terme, die einfacher aussehen, wenn der Logarithmus verwendet wird. Wenn das Verhältnis im Grenzwert mit zunehmendem x gegen unendlich geht, wird dies auch beim Logarithmus der Fall sein. In unserem Fall könnten wir , was für manche Leute einfacher zu betrachten ist. Wenn das Verhältnis der Überlebensfunktionen zu Null geht, geht der Logarithmus dieses Verhältnisses zulimx(log(σΓ(α)(βx)1α2π(log(x)μ))+βx(μlog(x))22σ2)=In allen Fällen müssen wir, nachdem wir die Grenze eines Logarithmus eines Verhältnisses gefunden haben, den Antilogarithmus dieses Wertes nehmen, um seine Beziehung zum Grenzwert des gewöhnlichen Verhältnisses der Überlebensfunktion zu verstehen.


2
In diesem Fall (und in einigen Fällen von Interesse) entspricht eine höhere Kurtosis einem schwereren Schwanz, aber dies ist im Allgemeinen nicht der Fall - Gegenbeispiele sind einfach zu konstruieren.
Glen_b

1
1. Ich kenne keinen allgemeinen Weg, um die Schwänze direkt zu vergleichen. 2. Was ist komplizierter? Die Antwort von whuber zeigt uns, warum es ein Problem gibt, etwas anderes als die Überlebensfunktion (für den rechten Schwanz) zu betrachten. er diskutiert, warum man pdfs nicht im detail vergleichen kann, aber ähnliche punkte auf die kurtosis übertragen werden. Darüber hinaus ist der Vergleich von oftmals weniger kompliziert als der Vergleich von Kurtosis. (Im linken Schwanz würden Sie direkt vergleichen, aber das war kein Problem für diese Frage.)S(x)=1F(x)F(x)
Glen_b

2
Ich stelle auch fest, dass Sie sagen: "Dies hat etwas mit einem Momentensatz zu tun, der besagt, dass, wenn (alle?) Die Momente zweier Verteilungen gleich sind, die Verteilungen identisch sind." - Auch wenn alle Momente zweier Verteilungen gleich sind, müssen die Verteilungen nicht identisch sein. Gegenbeispiele werden hier im Lebenslauf in Beantwortung mehrerer Fragen besprochen. Sie brauchen mehr als nur alle Momente gleich - Sie brauchen die MGF, um in einer Nachbarschaft von 0 zu existieren.
Glen_b

1
@PeterWestfall Eine semi-unendliche Unterstützung wird häufig angenommen, zum Beispiel als für Wirkstoffkonzentrationen im Blutplasma. In diesem Fall würde die Schwanzschwere bestimmen, ob die mittlere Verweilzeit des Arzneimittels im Körper etwas misst (z. B. Exponentialverteilung) oder nicht (z. B. einige Pareto-Verteilungen). 0t<
Carl

1
@ PeterWestfall Ich verstehe Ihren Standpunkt, ähnlich wie nma.berkeley.edu/ark:/28722/bk000471p7j . Es muss daran erinnert werden, dass jede Verteilung unterschiedliche Maßnahmen für unterschiedliche Dinge beinhaltet. Beispielsweise ist der durchschnittliche Extremwert MVUE für den Ort einer gleichmäßigen Verteilung, nicht der Mittelwert und nicht der Median. Zwischen diesen Extremwerten sind die Schwänze schwer, aber außerhalb davon sind die Schwänze mit einem Reißverschluss versehen. Was das mit einem höheren Moment wie Kurtosis zu tun hat, wenn der erste Moment nicht MVUE ist, würde ich nicht raten. Etwas vielleicht, aber was?
Carl
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.