Beispiel für zwei * korrelierte * Normalvariablen, deren Summe nicht normal ist


10

Mir sind einige schöne Beispiele für Paare korrelierter Zufallsvariablen bekannt, die geringfügig normal, aber nicht gemeinsam normal sind. Siehe diese Antwort von Dilip Sarwate und diese von Kardinal .

Mir ist auch ein Beispiel für zwei normale Zufallsvariablen bekannt, deren Summe nicht normal ist. Siehe diese Antwort von Macro . In diesem Beispiel sind die beiden Zufallsvariablen jedoch nicht korreliert.

Gibt es ein Beispiel für zwei normale Zufallsvariablen, die eine Kovarianz ungleich Null aufweisen und deren Summe nicht normal ist? Oder ist es möglich zu beweisen, dass die Summe zweier korrelierter normaler Zufallsvariablen, auch wenn sie nicht bivariate Normalvariablen sind, normal sein muss?

[Kontext: Ich habe eine Hausaufgabenfrage, in der nach der Verteilung von wobei und Standardnormalen mit Korrelation . Ich denke, die Frage sollte angeben, dass sie bivariat normal sind. Aber ich frage mich, ob etwas ohne diese zusätzliche Annahme für ungleich Null gesagt werden kann .]X Y ρ ρaX+bYXYρρ

Vielen Dank!


5
Die Antwort von Kardinal, die Sie zitieren, enthält bereits eine Lösung: Siehe die obere rechte Ecke in seiner Beispieltafel.
whuber

Können Sie bitte erklären, wie? Er spezifiziert eine gemeinsame Verteilung, die zwei normale Ränder ergibt. Mir ist nicht klar, dass die Summe der beiden normalen Ränder nicht normal ist, was ich will. (Siehe auch meinen Kommentar zu Glen_bs Antwort unten.)
mww

3
Allein aus dem Bild ist ersichtlich, dass die Dichte der Summe bei Null Null ist (weil die Linie die Darstellung in einem einzelnen Punkt schneidet, der das Maß Null hat), während die Summe selbst genauso offensichtlich symmetrisch ist Null, was zeigt, dass Null das Zentrum der Verteilung der Summe ist. Eine solche Verteilung kann nicht normal sein, da Normalverteilungen in ihren Zentren Dichten ungleich Null aufweisen. x+y=0
whuber

Antworten:


11

Fast jede bivariate Kopula erzeugt ein Paar normaler Zufallsvariablen mit einer Korrelation ungleich Null (einige geben Null, aber es handelt sich um Sonderfälle). Die meisten (fast alle) von ihnen produzieren eine nicht normale Summe.

In einigen Kopula-Familien kann jede gewünschte (Populations-) Spearman- Korrelation erzeugt werden; Die Schwierigkeit besteht nur darin, die Pearson-Korrelation für normale Ränder zu finden. Es ist im Prinzip machbar, aber die Algebra kann im Allgemeinen ziemlich kompliziert sein. [Wenn Sie jedoch die Populations-Spearman-Korrelation haben, ist die Pearson-Korrelation - zumindest für Ränder mit leichtem Schwanz wie die Gaußsche - in vielen Fällen möglicherweise nicht zu weit davon entfernt.]

Alle außer den ersten beiden Beispielen in der Darstellung des Kardinals sollten nicht normale Summen ergeben.


Einige Beispiele - die ersten beiden stammen beide aus derselben Kopula-Familie wie die fünfte der bivariaten Verteilungen des Kardinals, die dritte ist entartet.

Beispiel 1:

Clayton Copula ( )θ=0.7

Histogramme normaler Ränder, nicht normaler Summe und Diagramm der bivariaten Verteilung

Hier ist die Summe sehr deutlich spitz und ziemlich stark nach rechts geneigt

 

Beispiel 2:

Clayton Copula ( )θ=2

Histogramme normaler Ränder, nicht normaler Summe und Diagramm der bivariaten Verteilung

Hier ist die Summe leicht schief. Nur für den Fall, dass dies nicht für alle offensichtlich ist, habe ich hier die Verteilung umgedreht (dh wir haben ein Histogramm von in hellviolett) und es überlagert, damit wir die Asymmetrie klarer sehen können:(x+y)

überlagertes Histogramm von x + y und - (x + y)

 

Wir könnten die Richtung der Schiefe der Summe leicht austauschen , so dass die negative Korrelation ging mit der linken Schrägstellung und positiver Korrelation mit dem richtigen Schrägstellung (beispielsweise , indem man und in jedem die obigen Fälle - die Korrelation der neuen Variablen wäre dieselbe wie zuvor, aber die Verteilung der Summe würde um 0 gedreht, was die Schiefe umkehrt).X=XY=Y

Wenn wir dagegen nur einen von ihnen negieren, ändern wir die Assoziation zwischen der Stärke der Schiefe und dem Vorzeichen der Korrelation (aber nicht der Richtung).

Es lohnt sich auch, mit ein paar verschiedenen Copulas herumzuspielen, um ein Gefühl dafür zu bekommen, was mit der bivariaten Verteilung und den normalen Rändern passieren kann.

Die Gaußschen Ränder mit einer t-Copula können experimentiert werden, ohne sich um Details von Copulas zu kümmern (aus korreliertem bivariaten t erzeugen, was einfach ist, dann über die Wahrscheinlichkeitsintegraltransformation in einheitliche Ränder transformieren und dann über die Gaußsche Ränder in Gaußsche transformieren inverses normales cdf). Es wird eine nicht normale, aber symmetrische Summe haben. Selbst wenn Sie keine netten Copula-Pakete haben, können Sie einige Dinge ziemlich schnell erledigen (z. B. wenn ich versuchen würde, ein Beispiel schnell in Excel zu zeigen, würde ich wahrscheinlich mit der T-Copula beginnen).

- -

Beispiel 3 : (Dies ist eher das, womit ich anfangs hätte beginnen sollen)

Betrachten Sie eine Kopula, die auf einer einheitlichen Standard- basiert , und lassen Sie für und für . Das Ergebnis hat einheitliche Ränder für und , aber die bivariate Verteilung ist entartet. Wenn wir beide Ränder in normales transformieren , erhalten wir eine Verteilung für , die folgendermaßen aussieht:UV=U0U<12V=32U12U1UVX=Φ1(U),Y=Φ1(V)X+Y

Geben Sie hier die Bildbeschreibung ein

In diesem Fall beträgt die Korrelation zwischen ihnen etwa 0,66.

Also noch einmal, und sind zueinander in Beziehung stehenden Normalen mit einem (in diesem Fall deutlich) nicht-normale Summe - weil sie normale nicht bivariate sind.Y.XY

[Man könnte einen Bereich von Korrelationen erzeugen, indem man das Zentrum von (in für in ), um zu erhalten . Diese hätten eine Spitze bei 0 und dann eine Lücke zu beiden Seiten mit normalen Schwänzen.]( 1Uc[0,1(12c,12+c)cV.[0,12]V


Etwas Code:

library("copula")
par(mfrow=c(2,2))

# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
       col=rgb(0,100,0,70,maxColorValue=255),
       main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))

Das zweite Beispiel:

#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
    col=rgb(0,100,0,70,maxColorValue=255),
    main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))

Code für das dritte Beispiel:

#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)

Danke - aber wenn ich mich nicht irre, ist auch normal. (Wenn , erhalten wir und wenn , erhalten wir . Mit Wahrscheinlichkeit 1 erhalten wir also die Summe von zwei unabhängigen Standardnormalen, was normal ist.) Ich bin nach einem Fall, in dem die Summe von zwei korrelierten Normalen ist nicht normal, sondern ein Fall, in dem die Gelenkverteilung nicht normal ist. I = 0 U + V I = 1 2 Z.X+Y=2IZ+(1I)U+(1I)VI=0U+VI=12Z
MWw

Ganz richtig - durch meine verschiedenen Versuche, ein nicht-bivariat-normales Beispiel zu erstellen, in dem ich die Korrelation auswählen konnte, hörte ich irgendwo auf der Linie auf, die Summe nicht mehr zu überprüfen. Ich werde das Beispiel durch etwas ersetzen, bei dem ich eine nicht normale Summe demonstriere, aber es kann nicht direkt auswählen . Warte, es kann ungefähr eine Stunde dauern, bis ich dazu komme. ρ
Glen_b -State Monica

Ich habe das Beispiel durch zwei spezifische Beispiele unter Verwendung von Clayton-Copulas ersetzt
Glen_b -Reinstate Monica

Fabelhaft - danke! Besonderer Dank für den R-Code.
MWw

Ich habe ein drittes Beispiel hinzugefügt und am Ende einen Weg skizziert, um so etwas wie das zu bekommen, was ich ursprünglich versucht habe - einen Weg, um eine einstellbare Korrelation zwischen -1 und 1 zu erhalten (abgesehen von Sonderfällen an den Enden), aber für welche Die Summe ist nicht normal.
Glen_b -State Monica

-1

Ich habe mir ein Beispiel ausgedacht. X ist die normale Standardvariable und Y = -X. Dann ist X + Y = 0, was konstant ist. Kann jemand bestätigen, dass es sich um ein Gegenbeispiel handelt?

Wir wissen, dass wenn X, Y gemeinsam normal sind, auch ihre Summe normal ist. Aber was ist, wenn ihre Korrelation -1 ist?

Ich bin etwas verwirrt darüber. Danke.


Sie erhalten das gleiche gilt, wenn X = Y und dann XY = 0. Dies sind Normalverteilungen, die nicht bivariate Normalverteilungen sind. Daher muss die Eigenschaft, dass lineare Kombinationen von normal sind, die für die bivariate Normalen gilt, nicht angewendet werden.
Michael R. Chernick

@Zirui IMO ist eher ein entarteter Fall des Normalen ( ) als ein direktes Gegenbeispiel, obwohl dies von Ihren Definitionen abhängt. σ0
Glen_b -State Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.