Es wird unendlich viele Verteilungen geben, die Ihrer Zeichnung sehr ähnlich sehen, mit einer Vielzahl unterschiedlicher Werte für Kurtosis.
Unter den besonderen Bedingungen in Ihrer Frage und angesichts der Tatsache, dass der Übergangspunkt innerhalb oder zumindest nicht zu weit außerhalb von±1 , sollte es vorkommen, dass Sie eine etwas größere Kurtosis erhalten als bei der normalen. Ich werde drei Fälle zeigen, in denen dies geschieht, und dann einen zeigen, in dem es kleiner ist - und erklären, warum dies geschieht.
Da und das normale Standard-PDF bzw. -Cdf sind, schreiben wir uns eine kleine FunktionΦ ( x )ϕ(x)Φ(x)
f(x)={ϕ(x)a+b.g(x);|x|>t;|x|≤t
für eine kontinuierliche, symmetrische Dichte (mit entsprechendem cdf ) mit dem Mittelwert , so dass und .G 0gG0b=Φ(t)–½–t.ϕ(t)G(t)–½–t.g(t)a=ϕ(t)−b.g(t)
Das heißt, und werden gewählt, um die Dichte kontinuierlich zu machen und zu integrieren .ab1
Beispiel 1 Betrachten Sieund,g(x)=3ϕ(3x)t=1
Das sieht ungefähr so aus wie Ihre Zeichnung, die hier durch den folgenden R-Code generiert wird:
f <- function(x, t=1,
dg=function(x) 2*dnorm(2*x),
pg=function(x) pnorm(2*x),
b=(pnorm(t) - 0.5 - t*dnorm(t))/ (pg(t) - 0.5 - t*dg(t)),
a=dnorm(t)-b*dg(t) ) {
ifelse(abs(x)>t,dnorm(x),a+b*dg(x))
}
f1 <- function(x) f(x,t=1,dg=function(x) 3*dnorm(3*x),pg=function(x) pnorm(3*x))
curve(f1,-4,4,col=2)
lines(x,dnorm(x),col=3)
Nun die Berechnungen. Lassen Sie uns eine Funktion , um auszuwerten :xpf1(x)
fp <- function(x,p=2) x^p*f1(x)
so können wir die Momente bewerten. Zuerst die Varianz:
integrate(fp,-Inf,Inf) # should be just smaller than 1
0.9828341 with absolute error < 1.4e-07
Weiter der vierte zentrale Moment:
integrate(fp,-Inf,Inf,p=4) # should be just smaller than 3
2.990153 with absolute error < 8.3e-06
Wir brauchen das Verhältnis dieser Zahlen, das eine Genauigkeit von etwa 5 Stellen haben sollte
integrate(fp,-Inf,Inf,p=4)$value/(integrate(fp,-Inf,Inf)$value^2)
[1] 3.095515
Die Kurtosis ist also ungefähr 3.0955, etwas größer als im Normalfall.
Natürlich könnten wir es algebraisch berechnen und eine genaue Antwort erhalten, aber es besteht keine Notwendigkeit, dies sagt uns, was wir wissen wollen.
Beispiel 2 Mit deroben definiertenFunktionkönnen wir es für alle Arten vonversuchen.fg
Hier ist der Laplace:
library(distr)
D <- DExp(rate = 1)
f2 <- function(x) f(x,t=1,dg=d(D),pg=p(D))
curve(f2,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp2 <- function(x,p=2) x^p*f2(x)
integrate(fp2,-Inf,Inf) # should be just smaller than 1
0.9911295 with absolute error < 1.1e-07
integrate(fp2,-Inf,Inf,p=4) # should be just smaller than 3
2.995212 with absolute error < 5.9e-06
integrate(fp2,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.049065
Es überrascht nicht, dass ein ähnliches Ergebnis erzielt wird.
Beispiel 3 : Nehmen wirals Cauchy-Verteilung (eine Student-t-Verteilung mit 1 df), aber mit der Skala 2/3 (dh wennein Standard-Cauchy ist, istund setzen Sie den Schwellenwert t (geben Sie die Punkte, außerhalb derer wir zur Normalen 'wechseln') erneut auf 1.gh(x)g(x)=1.5h(1.5x)±t
dg <- function(x) 1.5*dt(1.5*x,df=1)
pg <- function(x) pt(1.5*x,df=1)
f3 <- function(x) f(x,t=1,dg=dg,pg=pg)
curve(f3,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp3 <- function(x,p=2) x^p*f3(x)
integrate(fp3,-Inf,Inf) # should be just smaller than 1
0.9915525 with absolute error < 1.1e-07
integrate(fp3,-Inf,Inf,p=4) # should be just smaller than 3
2.995066 with absolute error < 6.2e-06
integrate(fp3,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.048917
Und nur um zu zeigen, dass wir tatsächlich eine richtige Dichte haben:
integrate(f3,-Inf,Inf)
1 with absolute error < 9.4e-05
Beispiel 4 :Was passiert jedoch , wenn wir t ändern?
Nehmen Sie und als vorheriges Beispiel, aber ändern Sie den Schwellenwert auf :gGt=2
f4 <- function(x) f(x,t=2,dg=dg,pg=pg)
curve(f4,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp4 <- function(x,p=2) x^p*f4(x)
integrate(fp4,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 2.755231
Wie kommt es dazu?
Nun, es ist wichtig zu wissen, dass Kurtosis (etwas locker gesprochen) 1+ die quadratische Varianz über :μ±σ
Alle drei Verteilungen haben den gleichen Mittelwert und die gleiche Varianz.
Die schwarze Kurve ist die normale Standarddichte. Die grüne Kurve zeigt eine ziemlich konzentrierte Verteilung um ( die Varianz um ist gering, was zu einer Kurtosis führt, die sich 1 nähert, der kleinstmöglichen). Die rote Kurve zeigt einen Fall, in dem die Verteilung von "weggeschoben" wird . Das heißt, die Kurtosis ist groß.μ±σμ±σμ±σ
In diesem Sinne können wir, wenn wir die Schwellenwerte weit genug außerhalb von einstellen , die Kurtosis unter 3 drücken und haben immer noch einen höheren Peak.μ±σ