Die Summe der unabhängigen lognormalen Zufallsvariablen erscheint lognormal?


11

Ich versuche zu verstehen, warum sich die Summe von zwei (oder mehr) lognormalen Zufallsvariablen einer lognormalen Verteilung nähert, wenn Sie die Anzahl der Beobachtungen erhöhen. Ich habe online gesucht und keine diesbezüglichen Ergebnisse gefunden.

Wenn und Y unabhängige lognormale Variablen sind, ist X × Y aufgrund der Eigenschaften von Exponenten und Gaußschen Zufallsvariablen eindeutig auch lognormal. Es gibt jedoch keinen Grund anzunehmen, dass X + Y auch lognormal ist.XYX×YX+Y

JEDOCH

Wenn Sie zwei unabhängige lognormale Zufallsvariablen und Y generieren und Z = X + Y lassen und diesen Vorgang viele Male wiederholen, erscheint die Verteilung von Z lognormal. Es scheint sogar einer logarithmischen Normalverteilung näher zu kommen, wenn Sie die Anzahl der Beobachtungen erhöhen.XYZ=X+YZ

Zum Beispiel: Nach der Erzeugung von 1 Million Paaren ist die Verteilung des natürlichen Logarithmus von Z im folgenden Histogramm angegeben. Dies ähnelt sehr deutlich einer Normalverteilung, was darauf hindeutet, dass tatsächlich lognormal ist.Z.

Geben Sie hier die Bildbeschreibung ein

Hat jemand irgendwelche Einsichten oder Verweise auf Texte, die hilfreich sein können, um dies zu verstehen?


Nehmen Sie gleiche Varianzen für und Y an ? Wenn Sie simulieren , sieht das Protokoll der Summe nicht mehr ganz normal aus. XYxx <- rlnorm(1e6,0,3); yy <- rlnorm(1e6,0,1)
Stephan Kolassa

Ich habe gleiche Varianzen angenommen - ich werde es mit ungleicher Varianz versuchen und sehen, was ich am Ende habe.
Patty

Mit Abweichungen von 2 und 3 bekam ich etwas, das immer noch ein bisschen normal aussah, albiet mit etwas, das wie ein winziger kleiner Versatz aussieht.
Patty

1
Das Durchsehen früherer Fragen kann hilfreich sein. Hier und hier sind potenziell nützliche Papiere. Gut aussehen!
Stephan Kolassa

Antworten:


20

Diese ungefähre Lognormalität von Lognormalsummen ist eine bekannte Faustregel; Es wird in zahlreichen Zeitungen erwähnt - und in einer Reihe von Beiträgen vor Ort.

Eine logarithmische Näherung für eine Summe von logarithmischen Näherungen durch Anpassen der ersten beiden Momente wird manchmal als Fenton-Wilkinson-Näherung bezeichnet.

Dieses Dokument von Dufresne ist möglicherweise hilfreich ( hier oder hier verfügbar ).

Ich habe auch in der Vergangenheit manchmal Leute auf Mitchells Zeitung hingewiesen

Mitchell, RL (1968),
"Dauerhaftigkeit der logarithmischen Normalverteilung".
J. Optische Gesellschaft von Amerika . 58: 1267-1272.

Aber das wird jetzt in den Referenzen von Dufresne behandelt.

Aber während es in einer ziemlich breiten Reihe von nicht zu schrägen Fällen gilt, gilt es im Allgemeinen nicht, nicht einmal für iid lognormals, nicht einmal, wenn n ziemlich groß wird.

Hier ist ein Histogramm von 1000 simulierten Werten, jeweils das Protokoll der Summe von fünfzigtausend iid lognormalen:

Histogramm der Summe von fünfzigtausend Lognormalen

Wie Sie sehen ... ist das Protokoll ziemlich schief, so dass die Summe nicht sehr nahe an der logarithmischen Normalität liegt.

nn

* Ich habe nicht versucht herauszufinden, wie viele es sind, aber aufgrund der Art und Weise, wie sich die Schiefe der Summen (äquivalent Durchschnittswerte) verhält, werden einige Millionen eindeutig nicht ausreichen


μ=0σ=4

res <- replicate(1000,sum(rlnorm(50000,0,4)))
hist(log(res),n=100)

n=106


Können Sie bitte die Parameter (oder das Code-Snippet) hinzufügen, mit denen das Histogramm in der Abbildung erstellt wurde?
Altroware

1
μμ=0σμ=0σ44
Glen_b -Reinstate Monica

1
res <- replicate(1000,sum(rlnorm(50000,0,4))); hist(log(res),n=100)26.5

2

Es ist wahrscheinlich zu spät, aber ich habe das folgende Papier über die Summen der logarithmischen Normalverteilungen gefunden , das das Thema behandelt. Es ist nicht normal, aber etwas ganz anderes und schwer zu bearbeiten.


1

Das empfohlene Papier von Dufresne aus dem Jahr 2009 und dieses aus dem Jahr 2004 zusammen mit diesem nützlichen Papier behandeln die Geschichte der Annäherungen an die Summe der logarithmischen Normalverteilung und geben ein mathematisches Summenergebnis.

μσ

Vielleicht gibt Ihnen [dieses Papier] ( http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6029348 ) in einem bestimmten Fall eine Art zentralen Grenzwertsatz für die Summe der logarithmischen Normalen, aber es gibt immer noch einen Mangel an Allgemeinheit. Wie auch immer, das Beispiel von Glen_b ist nicht wirklich angemessen, da es ein Fall ist, in dem Sie den klassischen zentralen Grenzwertsatz leicht anwenden können, und in diesem Fall ist die Summe der logarithmischen Normalen natürlich Gauß.

n


1
Sie sagen, dass in meinem Beispiel "Sie können den klassischen zentralen Grenzwertsatz leicht anwenden", aber wenn Sie verstehen, was das Histogramm zeigt, können Sie die CLT eindeutig nicht verwenden, um zu argumentieren, dass für diesen Fall eine normale Näherung bei n = 50000 gilt; Die Summe ist so richtig schief, dass das Protokoll immer noch stark rechts schief ist. Der Punkt des Beispiels war, dass es sogar zu schief ist, um sich einem Lognormal anzunähern (oder dass das Histogramm sehr nahe an der Symmetrie aussehen würde). Eine Annäherung mit
geringerem Versatz

Ich stimme zu, aber wahrscheinlich wird in Ihrem Beispiel entweder die numerische Konvergenz der Stichprobe nicht erreicht (1000 Versuche sind zu wenig) oder die statistische Konvergenz wird nicht erreicht (50 000 Addenden sind zu wenig), aber im Grenzbereich bis unendlich sollte die Verteilung erfolgen sei Gauß, da wir uns in CLT-Bedingungen befinden, nicht wahr?
Mimì

Die 1000 Proben sind mehr als ausreichend, um die Form der Verteilung der Summe zu erkennen - die Anzahl der Proben, die wir nehmen, ändert nichts an der Form, wie "klar" wir sie sehen. Diese klare Schiefe wird nicht verschwinden, wenn wir eine größere Probe nehmen, sie wird nur glatter aussehen. Ja, 50.000 sind zu wenig, als dass die Summe normal aussehen könnte - es ist so richtig, dass das Protokoll immer noch sehr schief aussieht. Es kann durchaus viele Millionen erfordern, bevor es einigermaßen normal aussieht. Ja, das CLT gilt definitiv. es ist iid und die Varianz ist endlich, also müssen sich standardisierte Mittel schließlich der Normalität nähern.
Glen_b -State Monica

1

Das Lognormalgesetz ist in Bezug auf physikalische Phänomene weit verbreitet. Summen dieser Art von Variablenverteilungen werden beispielsweise benötigt, um das Skalierungsverhalten eines Systems zu untersuchen. Ich kenne diesen Artikel (sehr lang und sehr stark, der Anfang kann verstanden werden, wenn Sie kein Spezialist sind!), "Breite Verteilungseffekte in Summen lognormaler Zufallsvariablen", veröffentlicht 2003 (European Physical Journal B-Condensed Matter and Complex) Systems 32, 513) und ist unter https://arxiv.org/pdf/physics/0211065.pdf verfügbar .

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.